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这 是 一 本 内 容 丰 富 且 可 读 性 很 强 的 科普 书 ， 作 者 言 简 意 赚 地 为 读者 描绘 了 一 个 神 
秘 的 概率 世界 ， 书 中 避免 了 宛 长 的 数学 推导 和 复杂 的 公式 ， 取 而 代 之 以 妙趣 横生 的 例 
子 ， 为 读者 展示 了 概率 在 日 常生 活 中 所 起 的 作用 ， 这 些 例子 在 具备 娱乐 性 的 同时 又 富 
代表 性 。 比 方 说 ， 其 中 有 一 些 是 我 们 生活 中 不 易 察觉 但 与 概率 密切 相关 的 例子 ， 如 : 
日 问题 ， 购 物 的 最 优 策略 ， 等 车 时 间 问 题 等 ， 此 外 ， 还 有 一 些 违反 直觉 的 例子 ， 如 ; 
提 霍 尔 悖 论 、 辛 普 森 悖 论 、 决 斗 的 策略 等 。 同 时 书 中 也 介绍 了 许多 概率 统计 的 应 用 
其 原理 产生 的 背景 ， 如 : 贝 叶 斯 法 则 在 医疗 诊断 中 或 法 庭 断案 中 能 提供 的 帮助 等 。 

本 书 既 适合 学 生 增 加 学 习 兴趣 ， 又 适合 教师 作为 教学 参考 。 同 时 ， 数 学 爱好 者 以 
及 概率 统计 应 用 的 科技 人 员 也 能 从 中 获 益 。 
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你 是 否 留 意 过 生活 中 众多 事件 背后 的 区 
pp 


在 概 球 的 世界 里 挑战 你 的 直觉 。 





译 者 的 话 二 一 一 


与 大 多 数 科 普 读 物 一 样 ， 本 书 的 作者 用 最 朴素 的 语言 为 读者 描述 了 概率 
这 样 一 个 深奥 复杂 的 世界 。 同 时 用 化 繁 为 简 ， 深 入 浅 出 的 写作 手法 、 平 易 的 
叙述 方式 将 每 一 个 概率 理论 刀 九 道 来 ， 译 者 在 翻译 过 程 中 深 深 地 感受 到 了 作 
者 的 用 心 。 

俗话 说 :“ 没 有 规 系 不 成 方圆 。” 世 界 按照 自然 规律 在 运行 ， 只 有 当 你 懂 
得 了 这 些 规 律 ， 掌 握 并 学 会 运用 这 些 规律 时 ， 你 的 生活 才能 更 加 舒适 便利 。 
本 书 最 大 的 特色 在 于 作者 在 每 一 章节 之 中 都 会 巧妙 地 把 概率 的 理论 融入 生活 
的 点 点 滴 滴 中 ， 让 读者 切身 体会 到 概率 这 一 小 小 的 数字 贯穿 于 我 们 生活 的 方 
方面 面 ， 无 处 不 发 挥 它 的 作用 。 希 望 读者 通过 阅读 本 书 ， 学 以 致 用 ， 将 概率 
知识 运用 到 日 常生 活 中 去 。 

特别 感谢 中 国人 民 大 学 统计 学 院 王 星 老师 对 本 书稿 进行 了 审 校 。 由 于 译 
者 水 平 有 限 ， 译 文 错误 及 不 妥 之 处 请 读者 批评 指正 。 
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我 们 的 生活 与 小 数字 们 如 影 相 随 ， 本 书 是 关于 它们 的 故事 。 试 着 回想 你 
最 近 一 次 听 到 “概率 ”"、“ 机 会 ”、“ 胜 算 ” “随机 性 ”、“ 风 险 ” 或 者 “不 确 
定性 ”这 些 词 是 什么 时 候 ， 想 必 不 会 是 很 久 以 前 的 事 吧 。 在 这 本 书 中 ,我 将 
向 读者 讲述 关于 这 些 概 念 的 原理 以 及 如 何 运 用 它们 更 好 地 了 解 我 们 所 在 的 社 
会 。 此 书 并 不 是 一 本 教材 ， 所 以 它 既 没有 定义 、 定 理 、 也 没有 习题 。 我 写 这 
本 书 的 主要 目的 是 窜 教 于 乐 ， 你 当然 也 可 以 从 中 汲取 些许 知识 。 书 中 偶尔 会 
有 一 些小 练习 ， 但 这 些 练习 都 已 经 巧妙 地 贯穿 于 正文 当中 ， 也 许 你 自己 都 没 
有 意识 到 就 已 经 完成 了 这 些 练习 。 

首先 我 要 对 我 的 夫人 致 以 衷心 的 感谢 。 感 谢 AAXumaum 利用 闲暇 时 间 提 
供 各 种 生活 素材 协助 我 完成 作品 ， 尤 其 是 书 中 关于 希腊 词汇 的 运用 技巧 以 及 
我 早年 那些 难忘 的 旅行 经 历 ， 读 者 可 以 在 书 中 读 到 这 些小 故事 。 同 时 也 非常 
感谢 瑞典 哥德堡 查 尔 姆 斯 理工 大 学 Olle Higgstrom 教授 的 帮助 。 他 通读 了 整 
篇 手稿 ， 并 且 做 出 了 许多 深刻 、 准 确 又 客观 的 评论 。 如 果 读 者 在 本 书 中 看 到 
一 些 觉得 非常 思春 的 话语 ， 很 有 可 能 Olle Haggstrim 教授 审 稿 时 已 经 指出 过 ， 
但 我 还 是 固执 地 保持 了 原样 。 感 谢 苏 赛 克 斯 大 学 的 John Haigh 和 威 立 出 版 社 
的 Steve Quigley，Kris Parrish 和 Susanne Steitz， 还 有 许多 其 他 匿名 的 评论 意 
见 。 还 要 感谢 Sheree Van Vreede 出 版 服务 处 专业 的 编辑 工作 ， 以 及 特 克 斯 技 
术 公 司 的 Amy Hendrickson 对 我 过 到 的 技术 问题 进行 耐心 迅速 地 解答 。 

本 书 的 主要 内 容 是 在 2005 年 那个 纷乱 的 秋天 完成 的 。 我 们 在 当年 八 月 
旬 从 休斯敦 搬 到 了 新 奥尔良 ， 这 个 时 间 非 常 不 凑巧 ， 因 为 三 周 之 后 卡特 里 
昨 风 就 袭击 了 这 里 。 我 们 不 得 不 又 搬 回 了 休 斯 误 ， 但 随后 飓风 丽 塔 来 效 ， 于 
是 我 们 只 能 在 德 克 萨 斯 州 西 部 与 新 墨西哥 州 交 办 的 沙漠 中 避难 。 相 比 于 刚 风 ， 
沙尘暴 真是 客气 许多 ! 2006 年 1 月 我 们 终于 搬 回 了 新 奥尔良 ， 这 个 城市 非常 
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的 美 ， 铁 架 烤 牡 虹 更 是 代表 性 的 珍 似 美味 。 我 非常 感谢 那些 在 这 个 秋天 给 我 
们 提供 住宿， 并 在 各 方面 给 予 我 们 帮助 的 好 心 人 。 正 是 由 于 你 们 热情 的 帮助 ， 
本 书 才能 付 梓 。 感 谢 休 斯 敦 莱 斯 大 学 统计 系 的 凯 西 恩 索 公司 和 德 克 萨 斯 城 的 
大 陆 学 院 汤姆 英语 公司 为 我 提供 了 办 公 地 点 。 最 后 ， 感 谢 我 的 博士 论文 导师 
查 尔 姆 斯 理工 大 学 的 Peter Jagers 教授 ， 从 一 开始 写 这 本 书 时 就 一 直 给 予 我 
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实际 问题 。 同 时 概率 也 忆 





生活 中 的 概率 趣事 


不 管 你 是 否 愿意 承认 ， 概 率 的 确 主 党 着 我 们 的 生活 。 如 果 你 曾经 过 着 赌 徒 
式 的 生活 ， 那 你 必然 已 经 痛苦 地 意识 到 了 这 一 点 。 而 对 于 我 们 这 些 过 着 平凡 生 
活 的 人 来 说 ， 概 率 也 会 时 不 时 地 影响 着 我 们 。 这 些 影响 随处 可 见 ， 如 确定 保险 
费用 、 新 药物 的 引进 、 民 意 调查 、 天 气 预 报 和 法 庭 上 出 示 的 DNA 证 据 。 不 仅 
如 此 ， 概 率 还 关系 到 我 们 每 一 个 人 。 你 的 父亲 遗传 给 你 的 是 X 染色 体 还 是 Y 染 
色 体 ? 你 遗传 了 祖母 的 大 鼻子 吗 ? 从 更 专业 的 角度 来 看 ， 量 子 物 理学 家 告诉 我 们 
世间 万 物 都 是 由 概率 来 刻画 的 。 他 们 整 天 都 在 研究 苹 定 请 波动 方程 、 海 森 堡 不 确 
定性 原理 ， 这 些 术语 对 我 们 来 说 艰深 星 深 ， 但 是 至 少 从 中 可 以 得 出 一 个 结论 : 物 
理学 的 基本 定律 是 在 概率 的 基础 上 讨论 的 。 事 实 上 ， 和 牛顿 物理 定律 也 要 归功 于 概 
率 论 。 在 日 常生 活 中 我 们 常常 会 说 “对 这 件 事 ， 我 99% 地 确定 ”, “只 有 百 万 分 
之 一 的 可 能 ” 。 当 发 生 了 不 寻常 的 事情 时 ， 我 们 就 会 反问 道 “ 这 件 事情 有 多 大 的 
概率 发 生 呀 ?” 

我 们 中 的 一 些 人 以 概率 为 生 ， 包 括 发 展 新 的 概率 理论 ， 探 索 它 的 新 应 用 前 
景 ， 并 将 这 些 知 识 传授 给 人 们 ， 有 时 还 会 写 一 两 本 相关 的 书 。 我 们 自称 概率 学 
家 ， 但 数学 家 和 统计 学 家 的 称呼 要 比 概率 学 家 响亮 得 多 ,通常 你 可 以 在 一 所 大 学 
的 数理 统计 专业 发 现 我 们 的 身影 ， 但 却 没 有 办 法 找到 概率 专业 。 实 际 上 我 们 和 数 
学 家 、 统 计 学 家 都 能 沾 上 点 边 ， 但 我 们 通常 不 愿 承 认 这 一 点 。 如 果 我 在 一 场 鸡 尾 
酒会 上 说 自己 是 一 位 数学 家 或 者 统计 学 家 时 ， 人 们 大 概 都 会 兴味 索然 地 离开 。 但 
如 果 我 说 自己 是 一 位 概率 学 家 ……， 好 吧 ， 我 承认 大 多 数 人 还 是 会 离开 。 因 为 这 
听 起 来 就 像 提 线 木偶 戏 里 的 瑞典 厨师 正 用 一 些 生 涩 的 词 来 吸引 你 的 注意 。 但 至 少 
还 有 一 部 分 人 会 留 下 来 听 我 介绍 这 个 我 即将 带 你 们 走 进 的 世界 。 

现在 ， 让 我 们 把 自己 想象 成 一 位 语言 学 家 。 我 们 首先 从 概率 ( probability ) 
这 个 词 开 始 研究 它 的 含义 。 概 率 一 词 的 拉丁 词根 是 probare 和 habilis ， 前 者 的 意 
思 是 去 试验 ， 去 证 明 ， 或 者 是 去 批准 ; 后 者 表示 才能 ， 技 术 和 能 力 。 它 们 组 合 起 
来 的 单词 probable， 最 初 是 用 来 表示 “值得 肯定 的 ”。 在 后 来 的 使 用 中 probable 
一 词 才 渐渐 有 了 “可 能 的 ”、“ 合 理 的 ”这 一 层 意思 ， 这 才 跟 随机 性 产生 了 联 
系 。 在 我 的 母语 瑞典 语 中 ， 偶 然 性 一 词 对 应 的 单词 是 sannol 让 ， 它 在 字面 上 的 含 
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义 就 是 “ 跟 真理 一 样 的 ”。 德 语 中 wahrscheinlich 一 词 也 表示 这 个 意思 。 这 和 英语 
中 概率 一 词 还 是 有 细微 差别 的 ， 韦 氏 词 典 中 列举 出 了 这 些 细微 的 差别 。 对 我 们 来 
说 ,一 个 具体 概率 常用 来 描述 一 件 事情 发 生 的 可 能 性 ， 而 概率 论 指 的 是 概率 这 个 
学 科 。 

概率 伴随 着 随机 性 而 产生 。 许 多 人 就 什么 是 随机 性 这 个 问题 已 经 进行 了 深入 
的 探讨 ， 在 此 就 不 再 歼 述 了 ， 和 否则 整 本 书 就 会 陷 人 无 尽 的 哲学 讨论 中 。 法 国 数学 
家 皮 埃 尔 -西蒙 拉 普 拉 斯 (1749 一 1827) 曾 将 其 经 典 地 总 结 为 : “概率 是 由 我 
们 的 未 知 和 已 知 组 成 的 。” 在 拉 普 拉 斯 的 启发 之 下 ， 我 们 达成 了 共识 : 当 你 遇 到 
不 确定 性 时 ， 你 就 要 使 用 概率 了 。 比 如 : 

e@ 抛 硬币 、 掷 人 般 子 或 者 转 轮 盘 ; 

@ 观察 股市 、 天 和 气 或 者 美国 橄榄 球 超级 杯 大 赛 ; 

e@ 想 探 知 你 家 的 后 花园 究竟 有 没有 油井 ， 火 星 上 是 否 有 生命 ， 狂 王 是 否 还 
活着 。 

这 些 例 子 各 不 相同 ， 在 第 一 个 例子 的 3 种 游戏 中 ， 结 果 都 是 等 可 能 地 出 现 ， 
每 种 结果 出 现 的 概率 可 以 简单 用 结果 种 类 数 的 倒数 来 计算 ， 也 就 是 有 1/2 的 概率 
抛 到 硬币 的 正面 ， 有 1/76 的 概率 掷 出 数字 6，1738 的 概率 得 到 数字 29 (美式 轮 盘 
共有 38 个 数字 ,包括 1 至 36 号 、0 号 以 及 00 号 ) 。 这 些 都 是 显而易见 的 。 我 们 
能 够 计算 出 各 种 不 同 数字 出 现 的 概率 。 比 如 ， 在 掷 蜗 子 时 得 到 偶数 的 概率 有 多 
大 ? 由 于 在 6 个 数字 中 有 3 个 偶数 ， 因 此 结果 就 是 3/6 = 1/2。 这 些 都 是 古典 概率 
学 的 例子 ， 它 们 也 是 数学 家 们 研究 的 第 一 类 的 概率 问题 。 其 中 法 国 数学 家 拉 普 拉 
斯 和 帕斯卡 被 认为 是 最 为 杰出 的 代表 ， 他 们 在 17 世纪 的 来 往 信件 被 认为 是 最 早 
开始 对 概率 问题 进行 的 系统 研究 。 

下 面 我 将 列举 三 个 例子 来 说 明 我 们 是 如 何 将 数据 运用 于 概率 的 。 根 据 观察 得 
出 当前 的 天 气 状 况 有 20% 的 概率 会 下 雨 ， 那 么 我 们 就 说 今日 降水 概率 为 20% 。 
这 个 概率 会 随 着 天 气 数据 的 不 断 搜集 而 变化 ， 我 们 称 之 为 统计 概率 。 在 2006 年 
的 美国 橄榄 球 超级 杯 大 赛 中 ,我 在 休斯敦 德州 人 队 上 下 了 赌注 ， 赔 率 是 800: 1。 
这 意味 着 庄家 认为 休斯敦 德州 人 队 夺冠 的 概率 低 于 1/800。 庄 家 能 够 得 到 这 个 结 
论 除了 由 于 自己 曾经 在 休斯敦 度假 时 几乎 中 时 休克 之 外 ， 还 通过 很 多 数据 测算 从 
而 得 出 结论 。 


第 三 个 例子 与 前 两 个 例子 有 所 不 同 ， 原 因 在 于 结果 已 经 确定 ， 只 不 过 是 你 不 
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知道 它 而 已 。 比 如 究竟 有 没有 油井 这 个 问题 。 当 你 在 开始 挖 之 前 ， 你 始终 想 要 知 
道 发 现 石 油 的 概率 。 某 一 位 地 质 学 家 可 能 会 告诉 你 这 个 概率 是 75%。 但 是 这 个 
比例 并 不 是 说 一 年 中 有 九 个 月 油井 都 在 你 的 后 花园 ， 而 剩 下 的 三 个 月 在 你 的 邻居 
那里 。 它 只 是 表示 这 位 地 质 学 家 认为 你 挖 到 石油 的 概率 很 高 。 男 外 一 位 地 质 学 家 
认为 你 挖 到 石油 的 概率 是 85% ， 这 也 只 是 在 数值 上 的 变化 ， 内 涵 依 然 不 变 ， 也 
就 是 你 挖 到 石油 的 概率 真 的 很 大 。 我 们 把 这 些 称 为 主观 概率 。 但 问 不 同 的 人 “ 猫 
王 活着 的 概率 ”这 个 问题 ， 得 到 的 答案 要 么 是 0% 要么 是 100% 。 有 谁 会 说 猫 王 
有 25% 的 概率 活着 呢 ? 

了 解 一 些 关于 比例 的 知识 对 我 们 计算 主观 概率 大 有 神 益 。 假 设 你 在 匹兹堡 的 
姑姑 简 给 你 打 电 话 告诉 你 她 的 新 邻居 人 很 好 ， 并 且 有 一 份 跟 恒 星 、 占 星 家 或 天 文 
学 家 有 关 的 工作 。 如 果 没 有 足够 的 信息 ， 这 个 邻居 是 一 位 天 文学 家 的 概率 有 多 
大 ? 在 几乎 没有 任何 信息 的 前 提 下 ， 你 会 说 是 30% 吗 ? 有 些 人 会 这 样 认 为 。 但 
是 你 必须 要 考虑 这 个 事实 : 在 美国 占星 家 的 数量 是 天 文学 家 的 四 倍 ， 所 以 20% 
的 概率 更 加 现实 。 不 要 因为 一 件 事情 是 “或 者 …… 或 者 …… ”就 认为 它 的 概率 
是 一 半 对 一 半 。 在 这 种 情况 之 下 ， 安 迪 … 鲁尼 的 50-50-90 规则 显得 无 比 害 吞 ， 
他 说 :“ 当 你 有 50% 的 机 会 猪 对 一 件 事 时 ,那么 也 许 有 90% 的 可 能 你 猜 的 是 错 
的 。” 也 就 是 说 ， 如 果 两 件 事 机 会 均等 ， 那 么 猜 对 事件 发 生 的 可 能 性 微乎其微 。 


























1.2 概率 学 家 的 玩具 和 语言 


概率 学 家 都 喜欢 玩 便 币 和 山子 。 从 柏拉图 式 理念 的 角度 上 看 ， 我 们 喜欢 一 切 
出 现 跟 抛 人 硬币 和 撕 角 子 一 样 的 等 可 能 事件 的 实验 。 假 设 现在 有 一 个 家 庭 有 四 个 孩 
子 ， 随 机 选择 孩子 。 四 个 孩子 全 是 女孩 的 概率 有 多 大 ? 如 果 用 抛 硬币 的 方法 ， 就 
是 连 抛 四 次 硬币 每 一 次 都 出 现 正 面 的 概率 。 很 多 概率 问题 都 可 以 用 抛 硬币 的 方法 
解决 。 但 重复 使 用 这 种 方法 会 让 大 家 觉得 枯燥 无 味 。 所 以 我 们 就 用 掷 仍 子 、 转 轮 
盘 、 从 盒子 里 拿 球 或 抽 扑 区 牌 这 些 方法 来 蔡 代 ， 在 本 书后 面 有 关 博 彩 那 章 将 会 详 
细 介 绍 这 些 游 戏 的 玩法 。 因 为 概率 最 早 就 是 从 博彩 中 起 源 的 。 

概率 是 表达 不 确定 性 的 一 门 艺术 。“ 抛 硬币 抛 到 正面 的 概率 是 1/2” 是 一 个 
精确 的 表述 。 它 表示 抛 到 正面 和 反面 的 概率 是 一 样 的 。 这 也 是 在 长 期 反复 试验 的 
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情况 下 考虑 概率 的 一 种 方式 。 如 果 你 连续 不 断 地 抛 硬币 ， 从 长 远 来 看 差不多 有 
50% 的 概率 出 现 正面 ，50% 的 概率 出 现 反面 。 这 是 你 能 够 确定 的 事 ， 但 你 不 能 确 
定 的 是 下 一 次 抛 的 硬币 究竟 是 正面 还 是 反面 。 

概率 学 家 们 也 有 自己 的 术语 。 例 如 ， 我 们 通常 会 把 不 确定 的 情形 称 为 “ 试 
验 ”。 这 种 情形 可 能 是 一 次 真实 的 抛 硬币 或 掷 骨 子 试验 ， 也 有 可 能 是 完全 不 同 的 
股市 起 伏 或 者 是 温 布尔 登 网球 决 赛 。 试 验 结果 可 能 是 “正面 朝 上 ”、“6”、“ 沃 尔 
沃 的 股价 上 涨 "、“ 比 约 : 博 格 赢 了 ” (这些 都 是 现实 试验 的 一 种 真实 结果 ) 。 这 
些 结果 就 叫做 “事件 ”。 简 而 言 之 , 事件 是 指 发 生 在 试验 中 的 结果 。 它 可 以 是 一 
个 简单 的 结果 (比如 山子 的 数字 6) 也 可 以 是 一 组 结果 (比如 般 子 中 的 偶数 ) 。 
关于 事件 这 个 概念 的 数学 描述 就 是 : 事件 是 所 有 可 能 的 结果 的 集合 中 的 一 个 子 
集 。 数 学 家 们 把 这 个 结果 称 为 集合 的 一 个 元 素 。 统 计 学 家 用 “结果 ”和 “事件 ” 
来 强调 与 现实 生活 中 发 生 的 事情 的 联系 。 在 公式 中 ， 通 常用 大 写字 母 来 指 代 具体 
的 事件 ， 用 字母 “P” 来 表示 概率 。 因 此 P(4) 表示 的 意思 就 是 “事件 4 发 生 的 

所 有 可 能 出 现 的 结果 的 集合 被 称 为 样本 空间 2?。 在 有 些 情 况 下 ， 样 本 空间 的 
选择 多 种 多 样 。 假 设 你 现在 抛 两 枚 硬币 ， 需 要 知道 两 枚 便 币 同时 正面 朝 上 的 概 
率 。 这 时 可 能 出 现 的 正面 朝 上 的 硬币 个 数 为 0、1、2。 你 可 能 会 将 这 三 个 数字 选 
为 样本 空间 ， 然 后 平均 下 来 每 种 结果 出 现 的 可 能 性 为 1/3。 但 是 ， 如 果 你 不 断 重 
复 这 个 试验 ， 过 一 段 时 间 你 会 发 现 得 出 两 枚 硬币 同时 朝 上 的 概率 小 于 1/3。 问 
题 就 在 于 你 选择 的 样本 空间 包含 的 三 个 结果 并 不 是 等 可 能 地 出 现 。 现 在 让 我 们 
区 分 一 下 这 两 枚 硬币 ， 将 其 中 的 一 枚 涂 成 红色 ， 另 外 一 枚 涂 成 蓝 色 。 它 们 将 会 
等 可 能 出 现 四 种 结果 : 同时 正面 朝 上 ; 红色 的 正面 朝 上 ， 蓝 色 的 反面 朝 上 ; 红 
色 的 反面 朝 上 ， 蓝 色 的 正面 朝 上 ; 同时 反面 朝 上 。 让 我 们 以 一 种 更 为 简单 明了 
的 方式 把 这 四 种 情况 表现 出 来 : HH、HT、TH、TTS。 四 种 情况 中 有 一 种 是 两 
枚 硬币 同时 正面 朝 上 ， 所 以 正确 的 概率 应 当 是 1/4。 图 1-1 所 示 为 抛 两 枚 硬币 
出 现 的 四 种 结果 。 









































”样本 空间 是 数学 家 们 的 标志 性 术语 。1913 年 ， 奥 匈 帝 国 战斗 机 飞行 员 理 查 德 . 冯 ' 米 泽 斯 在 他 的 
德 文 著作 《概率 微 积分 》 中 创造 了 Merkmahlraum 一 词 ， 在 德语 中 表示 样本 空间 的 意思 。 
四 于 为 英文 单词 head， 表 示 正 面 朝 上 。T 为 英文 单词 tail 表示 反面 朝 上 。 
























































生活 中 的 概率 趣事 


ramarCD CD CD GD 
smn CD CD CD 


图 1-1 抛 两 枚 硬币 等 可 能 出 现 的 四 种 结果 


接 下 来 这 个 问题 也 是 相同 的 。 假 设 要 掷 两 次 仍 子 ， 得 到 两 次 的 点 数 之 和 等 于 
8 的 概率 有 多 大 ? 首先 我 们 需要 明确 ， 掷 两 次 仍 子 点 数 之 和 可 以 是 2、3、…、 
12, 但 是 它们 出 现 的 概率 是 不 一 样 的 。 为 了 找 出 每 种 可 能 出 现 的 结果 ， 我 们 同样 
需要 用 前 面 提 到 的 区 分 硬币 的 方法 来 区 分 一 下 这 两 个 散 子 ， 也 就 是 将 它们 分 别 涂 
上 红色 和 蓝 色 。 点 数 之 和 等 于 8， 存 在 着 以 下 三 种 情况 . 2+6, 3 +5, 4+4。 我 
们 首先 认为 36 种 结果 之 中 有 三 种 情况 能 够 得 到 总 和 等 于 8。 但 是 我 们 还 需要 进 一 
步 作 出 区 分 。 比 如 将 2 +6 这 种 情况 区 分 为 蓝 色 山 子 点 数 为 2， 红 色 为 6 的 情况 和 
蓝 色 山 子 点 数 为 6， 红 色 为 2 的 情况 。 这 样 区 分 之 后 ， 我 们 就 会 意识 到 一 共有 五 
种 情况 可 以 得 出 点 数 之 和 为 8 的 结果 。 因 此 ， 两 次 的 点 数 之 和 等 于 8 的 事件 的 概 
率 就 是 5/36 了 。 详 细 的 样本 空间 分 布 如 图 1-2 所 示 。 





图 1-2 这 个 样本 空间 是 搓 两 次 朋 子 可 能 
出 现 的 36 种 结果 。 点 数 之 和 为 8 的 事件 用 椭 
圆 标 注 出 来 了 ， 总 共有 5 种 可 能 。 因 为 得 到 2 
和 6 与 得 到 3 和 5 同时 都 存在 两 种 情况 ， 而 得 
到 4 和 4 只 存在 一 种 情况 。 











图 1-2 挪 两 个 贷 子 的 样本 空间 


接 下 来 我 们 再 举 一 个 类 似 的 例子 。 假 设 一 个 家 庭 有 三 个 孩子 ， 那 么 只 有 一 个 
女儿 的 概率 是 多 大 呢 ? 实际 上 ， 这 个 家 庭 可 能 有 0、1、2、3 个 女儿 ， 而 这 四 种 
情况 出 现 的 概率 是 不 一 样 的 。 我 们 把 这 三 个 孩子 按照 出 生 的 顺序 进行 排列 区 分 ， 
比如 说 BGB 代表 第 一 个 孩子 是 男孩 ， 第 二 个 孩子 是 女孩 ,第 三 个 是 男孩 。 那 么 ， 


第 1 章 计算 可 能 性 : 算 对 了 还 是 算 错 了 


可 能 会 出 现 8 种 不 同 的 结 
BBB, BBG, BGB, GBB, BGG, GBG, GGB, GGG 

现在 我 们 能 够 很 轻松 地 算出 只 有 一 个 女儿 的 概率 是 3/8。 现 在 来 算 一 算 这 
个 随机 选 出 来 的 女孩 的 同胞 没有 姐妹 的 概率 是 多 少 呢 ? 这 种 情况 看 起 来 也 很 相 
似 。 她 没有 姐妹 ， 意 味 着 这 个 有 着 三 个 孩子 的 家 庭 有 只 有 一 个 是 女孩 的 概率 是 
3/8。 相 信 这 个 结论 吗 ? 你 不 应 该 相信 。 这 种 情况 是 完全 不 同 的 ， 因 为 我 们 并 
不 是 随意 选 了 一 个 有 三 个 孩子 的 家 庭 ， 而 是 选择 三 个 孩子 中 至 少 有 一 个 是 女 
孩 ， 因 此， 出 现 BBB 的 情况 是 不 可 能 的 。 那 么 概率 变 成 了 3/7 吗 ? 思考 一 会 再 
往 下 看 吧 。 

我 希望 你 思考 之 后 的 答案 是 否定 的 。 要 解决 这 个 问题 我 们 需要 一 个 完全 不 同 
的 样本 空间 。 我 们 用 星 号 * 来 标明 这 个 确定 的 女孩 ， 那么 将 会 出 现 如 下 12 种 


情形 : 














BBG*, BG*B, G’*BB, BG’G, BGG*, G’BG 
GBG”, G*GCB, GG*B, GGG, GG’G, GGG” 

因此 ， 这 个 女孩 没有 姐妹 的 概率 为 3/12 = 1/4。 提 醒 大 家 注意 之 前 的 那些 结 
果 在 这 个 样本 空间 中 是 如 何 被 拆 分 的 。 三 个 孩子 都 是 女孩 的 情形 ， 即 出 现 GGG 
的 情况 有 三 次 ， 因 为 任何 一 个 女孩 都 可 能 是 我 们 指定 的 那个 。 我 们 计算 出 来 的 结 
果 表 明 有 三 个 孩子 的 家 庭 中 只 有 一 个 女孩 的 占 37.5% ， 而 25% 的 来 自 三 个 孩子 
家 庭 的 女孩 并 没有 姐妹 。 

那么 三 个 孩子 性 别 相 同 的 概率 又 是 多 少 呢 ?9 首先 考虑 一 下 这 个 不 太 完 整 的 论 
证 方法 : 其 中 两 个 孩子 必定 是 同性 别 的 ， 而 对 于 第 三 个 孩子 来 说 是 男孩 或 是 女孩 
的 概率 是 一 样 的 。 因 此 三 个 孩子 同性 别 的 概率 是 1/2。 这 个 例子 就 是 投掷 硬币 问 
题 的 变形 。 早 在 1894 年 ， 英 国 贵族 出 生 的 业余 科学 家 弗朗西斯 . 高 尔 顿 荔 士 就 
用 投掷 硬币 问题 来 说 明 草 率 思 维 的 危害 (在 后 文 将 会 进行 详细 介绍 ) 。 让 我 们 用 
第 一 个 样本 空间 来 发 现 错误 ,证 明正 确 的 概率 应 该 是 1/4。 

有 一 个 古老 的 博弈 问题 跟 这 一 事件 异曲同工 。 甲 、 乙 二 人 参与 投 据 三 颗 如 子 
的 游戏 ， 如 果 三 个 数 相 加 之 和 为 9， 则 甲 赢 ; 而 如 果 三 个 数 之 和 为 10， 则 乙 赢 。 
如 果 既 不 是 9 也 不 是 10， 那 么 就 继续 投掷 。 这 种 游戏 规则 公平 吗 ? 

有 以 下 6 种 情况 ， 三 个 数 相 加 之 和 可 以 为 9: 

1+2+6, 1 +3+5, 1 +4+4, 2+2+5, 2+3+4, 3+3+3 
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同样 有 6 种 情况 可 以 使 其 和 为 10， 分 别 是 ; 
1+3+0,， 1 +4+5, 2+2+6, 2+3+5, 2+4+4, 3+3+4 

看 起 来 这 个 游戏 非常 公平 ， 但 是 从 长 远 来 看 乙 肯 定 会 逐渐 赢 甲 。 这 是 为 什 
么 呢 ? 

当 你 下 定 决 心 要 玩 这 个 游戏 时 ， 首 先 需 要 确定 两 种 方式 投掷 结果 的 概率 是 相 
同 的 。 就 像 之 前 考虑 两 个 仍 子 的 问题 一 样 ， 假 设 三 个 仍 子 有 三 种 不 同 的 颜色 ， 分 
别 是 红色 、 绿 色 和 蓝 色 。 如 果 我 们 按 顺 序 来 投掷 这 三 个 仍 子 ， 可 能 得 出 的 结果 是 
(1,1,，1)，(1,，1,，2)，(1，2，1)，(2，1,，1)，(2，2，1)， 一 直到 
(6，6，6); 我 们 可 以 立刻 知道 总 共有 6 x6 x6 =216 种 可 能 性 。 让 我 们 来 看 有 多 
少 种 情况 得 出 组 合 1 +4 +4， 结 果 为 9。 这 种 组 合 对 应 这 三 种 可 能 出 现 的 情况 : 
(1, 4, 4)，(4，1，4)，(4，4，1) 。 接 下 来 讨论 1+2 +6 这 种 组 合 ， 它 对 应 有 
6 种 可 能 : (1, 2, 6), (1, 6, 2), (2, 1, 6) (2, 6, 1), (6, 1, 2), 
(6, 2，1)。 总 之 ， 如 果 三 个 骨 子 拨 出 来 的 是 不 同 的 数字 ， 那 么 一 共有 6 种 可 能 
性 ; 如 果 两 个 货 子 掷 出 来 的 是 相同 的 数字 ， 那 么 有 三 种 可 能 出 现 的 情况 ; 如果 三 
个 数字 都 是 一 样 的 ， 那 只 有 一 种 可 能 。 

现在 我 们 知道 总 和 为 10 有 27 种 可 能 ， 但 总 和 为 9 只 有 25 种 可 能 。 决 胜 关 
键 点 就 在 于 出 现 3 +3 +3 只 有 一 种 情况 , 但 出 现 3+3 +4 有 三 种 情况 。 详 情 可 以 
参见 图 1-3。 因 此 ， 在 出 现 的 52 种 有 关 输 赢 的 情况 中 ，27 种 情况 是 乙 说 ,概率 
大 约 是 52% ， 而 甲 只 能 在 剩 下 的 25 种 情况 出 现时 赢 ， 换 而 言 之 甲 赢 的 概率 是 
48% 。 虽 然 差异 不 大 ， 但 足够 让 一 些 庄 家 以 此 谋生 了 (风险 投资 也 是 赁 这 种 方式 
运行 的 ) 。 



















































































图 1-3 出 现 两 个 3 一 个 4 有 三 种 情形 ( 左 图 ) ， 但 是 通过 三 个 3 
得 到 9 只 有 一 个 情形 。( 右 图 ) 。 
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望远镜 之 父 伽 利 略 在 观察 了 一 群 佛罗伦萨 贵族 赌博 之 后 就 已 经 解决 了 这 个 问题 。 
想象 一 下 这 个 世界 上 最 聪明 的 科学 家 居然 会 花 时 间 帮 助人 们 解决 赌博 问题 ， 你 都 
会 觉得 乐 不 可 支 。 对 于 爱 因 斯 坦 来 说 值得 庆幸 的 是 在 19 世纪 30 年 代 的 亚特兰大 
城 还 没有 赌场 。 否 则 那些 身 无 分 文 的 赌 徒 一 定 会 如 潮水 般 涌 向 他 在 善 林 斯 顿 的 办 
公 室 ， 跪 求 这 位 天 才 的 帮助 。 

人 们 常常 会 对 包含 不 止 一 个 事件 的 问题 感 兴趣 。 比 如 ， 民 意 调查 会 同时 调查 
人 们 的 抽烟 习惯 和 政治 同情 心 。 现 在 假设 用 S 来 指 代 调 查 的 对 象 抽 烟 ， 用 RR 来 指 
代 调 查 对 象 是 共和 党 。 我 们 可 以 随机 制造 事件 。 当 他 既是 一 个 吸烟 者 ， 又 是 一 个 
共和 党 人 ， 我 们 把 这 种 情况 标记 为 “5 与 R*”。 当 他 或 许 是 一 个 吸烟 者 ,或 许 是 
一 个 共和 党 人 ， 这 一 事件 标记 为 “5 或 R”。 记 住 ， 当 我 们 描述 为 “5 或 R” 时 意 
味 着 这 个 调查 对 象 可 能 是 吸烟 者 ， 可 能 是 共和 党 人 ， 也 可 能 两 者 都 是 。“ 或 ”的 
定义 是 一 个 典型 的 数学 、 逻 辑 和 计算 机 科学 问题 。 在 日 常用 语 中 ， 我 们 通常 用 的 
“与 /或 ”的 语 境 与 数学 家 们 口中 的 “ 互 斥 ”是 不 同 的 。 后 者 意味 着 两 者 之 中 只 
能 存在 一 者 ， 比 如 “你 想 要 萝 条 还 是 洋葱 圈 ?” 

而 “被 调查 对 象 不 是 共和 党 人 ”这 一 事件 仅仅 意味 着 “ 非 R 。“ 被 调查 对 
象 既 不 是 一 个 共和 党 人 也 不 是 一 个 吸烟 者 ”这 一 事件 要 用 其 他 方式 表述 。 一 种 方 
法 就 是 否定 “或 "， 即 “ 非 (R 或 5)”。 男 一 种 方法 就 是 先 分 别 否 定然 后 就 再 相 
与 即 “( 非 R) 与 ( 非 $)”。 这 两 者 等 价 ， 如 等 式 

非 (R 或 $) =( 非 R) 与 ( 非 $) 
括号 是 用 来 清楚 地 表示 被 否定 的 部 分 。 同 理 ， 
非 (R 与 $) =( 非 R) 或 ( 非 5) 

熟悉 上 面 这 些 简单 例子 中 包含 的 逻辑 是 非常 必要 的 ， 因 为 我 们 在 下 文中 还 会 

使 用 这 种 表达 方式 。 

















我 在 前 文 提 到 这 是 一 个 古老 的 问题 。 事 实 上 早 在 400 年 前 伟大 的 天 文学 家 ， 本 






























































1.3 概率 学 家 的 法 则 


概率 可 以 用 分 数 表示 ， 也 可 以 用 十 进 制 数 表示 ， 还 可 以 用 百分比 表示 。 当 你 
抛 一 枚 硬币 的 时 候 ， 得 到 正面 向 上 的 概率 是 1/2， 也 就 是 0.5， 或 者 也 可 以 表示 
为 50% 。 对 于 什么 情况 下 用 哪 一 种 形式 来 表示 并 没有 严格 的 规定 ， 在 本 书 中 三 
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种 表达 的 方式 都 会 出 现 。 在 日 常情 况 中 ， 我 们 通常 会 习惯 于 用 真 分 数 来 表达 ， 比 
如 “十 个 中 有 一 个 ”而 不 是 “十 分 之 一 ”。 在 你 处 理 相同 概率 事件 的 时 候 也 通常 
会 这 样 用 。 十 进 制 数 在 科技 报告 的 数据 计算 中 更 为 常见 。 而 百分比 则 常 在 日 常用 
语 中 与 “机 会 ”一 块 出 现 ， 代 替 了 “概率 ”一 词 。 例 如 ， 和 气象 学 家 通常 会 说 
“有 20% 的 降水 机 会 ”。 它 与 “降水 的 概率 是 0.2” 表 达 的 是 同样 的 意思 。 当 从 
理论 的 角度 上 来 看 概率 问题 时 ， 我 们 通常 会 把 这 些 数 字 想 成 在 0 ~ 1 区 间 中 任何 
一 个 小 数 ， 而 不 是 以 百分数 的 形式 出 现 。 

无 论 以 何 种 方式 表示 ， 概 率 遵 循 一 些 基本 法 则 。 一 个 自然 的 法 则 就 是 概率 永 
远 不 可 能 是 负数 。 概 率 最 小 值 只 能 取 0， 它 意味 着 我 们 所 面 对 的 这 件 事情 不 可 能 
发 生 。 概 率 不 可 能 低 至 -0.3 或 者 是 -59 。 

第 二 个 法 则 就 是 某 件 事 不 发 生 的 概率 可 以 表示 为 1 减 去 这 件 事 发 生 的 概率 。 
用 公式 表达 即 为 : P( 非 4) =1 -P(4)。 这 个 法 则 很 容易 接受 。 在 找 骨 子 的 时 候 
得 出 的 结果 不 是 6 的 概率 是 5/6， 它 等 于 1 -1/6。 如 果 降 水 概率 是 20% ， 那 么 不 
降水 的 概率 是 80% 。 这 个 法 则 看 似 简 单 ， 却 非常 实用 。 事 实 上 ， 在 约翰 . 黑 格 
的 著作 《 抓 住 机 遇 : 概率 制胜 》(《Taking chances: winning with Probility》) 中 ， 这 
一 法 则 被 称 为 概率 的 第 一 法 则 。 

在 博彩 世界 中 ， 概 率 通常 会 被 称 为 胜算 。 如 果 说 事件 4 的 胜算 是 4:1， 这 意 
味 着 事件 4 不 发 生 的 概率 是 其 发 生 概 率 的 4 倍 。 因 此 我 们 可 以 得 出 这 一 等 式 
P( 非 4) =4xP(4)， 进 而 得 出 P(4) =1/5,P( 非 4) =4/5。 博彩 中 庄家 是 以 此 为 
生 的 ,4:1 的 胜算 意味 着 他 们 认为 事件 4 发 生 的 概率 其 实 是 小 于 175 的 。 

第 三 个 法 则 是 : 如 果 4 事件 发 生 那 么 B 事件 一 定 发 生 ， 则 P(A) 小 于 或 等 
于 P(B)， 它 的 数学 表达 式 为 P(A4) <P(B)。 例如 ,4 事件 为 找 骨 子 撕 出 数字 6， 
了 事件 为 掷 出 的 数字 是 偶数 。 当 4 事件 发 生 时 8B 事件 一 定 也 会 发 生 , 但 是 事件 
发 生 并 不 意味 着 4 一 定 发 生 ， 可 能 出 现 的 数字 是 2 或 4。 特 别 值得 注意 的 是 ， 两 



































名 ”我 不 清楚 你 们 对 于 负数 的 理解 有 多 深 ， 但 是 对 于 数学 家 们 来 说 负数 就 像 空气 和 水 一 样 熟 悉 。 接 下 
来 我 要 讲 数学 界 最 大 的 一 个 笑话 : 一 个 化 学 家 、 一 个 物理 学 家 和 一 个 数学 家 坐 在 街 边 的 咖啡 店 看 
对 面 的 房子 。 过 了 一 会 ， 两 个 人 进入 了 这 间 房 。 又 过 了 一 会 ， 三 个 人 走出 来 了 。 化 学 家 说 : “这 
是 繁殖 ”物理 学 家 说 :“ 这 是 测量 误差 。” 数 学 家 说 :“ 呢 …… 如 果 一 个 人 再 走 进 这 间 房 子 的 话 ， 
这 间 房 子 才 会 没 人 。” 
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个 事件 同时 发 生 的 概率 总 是 不 超过 每 个 事件 单独 发 生 的 概率 。 换 而 言 之 ,不论 
A4、B 事件 的 概率 是 多 少 ，P(4 与 B) 总 是 不 超过 P(4) 或 P(B)。 

我 们 再 来 举 一 个 生动 一 点 的 例子 。 布 罗 德 太太 和 带 波 多 太太 在 篇 爷 旁 边 聊 
天 ， 她 们 的 新 邻居 正好 路 过 。 这 是 一 位 60 多 岁 的 老头 儿 ， 衣 衫 裤 社 ， 远 远 地 就 
可 以 闻 到 他 身上 那 股 劣质 威士忌 的 味道 。 布 罗 德 太太 在 此 之 前 见 过 他 ， 于 和 是 她 告 
诉 带 波多 太太 这 个 老头 儿 是 前 路 易 斯 安 那州 参议 员 。 蒂 波多 太太 觉得 这 太 不 可 思 
议 了 。 布 罗 德 太太 说 道 : “是 的 ， 他 就 是 前 不 久 那 个 陷入 丑闻 风波 的 州 参议 员 ， 
被 迫 套 职 后 他 就 开始 酮 酒 了 。” 带 波多 太太 说 : “这 听 起 来 才 更 通 真 呢 。 “不 ，” 
布 罗 德 太太 反驳 道 :“ 难 道 你 认为 我 在 骗 你 吗 ?。 

严格 说 来 ， 布 罗 德 太太 的 质疑 是 对 的 。 我 们 来 看 看 下 面 这 两 句 对 这 个 衣衫 裕 
禄 的 男人 的 描述 :“ 他 是 前 州 参 议员 ”和 “他 是 前 不 久 那 个 陷入 丑闻 风波 的 州 参 
议员 ， 被 迫 辞 职 后 他 就 开始 柄 酒 了 ”。 听 起 来 后 一 句 的 描述 更 像 是 真 的 ， 因 为 它 
对 柄 酒 进行 了 详细 的 解释 。 但 正 是 因为 这 种 解释 使 得 它 的 真实 性 更 低 。 我 们 需要 
注意 到 ， 如 果 第 二 句 话 是 真实 的 ， 那 么 必须 要 先 证 明 第 一 句 话 是 真实 的 。 反 之 就 
不 是 这 样 了 。 因 此 ， 第 二 句 话 真实 的 概率 更 低 〈 从 蒂 波 多 太太 主观 角度 来 说 ， 布 
罗 德 太太 当然 知道 这 个 男人 是 谁 ) 。 这 个 例子 便 是 诺 贝尔 奖 2 得 主 丹尼尔 卡 纳 曼 
与 保罗 . 斯 洛 维 奇 和 阿 摩 司 . 特 沃 斯 基 三 人 合 著 的 《Judgment under uncertainty》 
一 书 中 描写 的 一 个 例子 。 他 们 用 经 验 揭 示 了 人 们 在 众多 陈述 中 选择 一 个 真实 性 最 
高 的 陈述 时 通常 会 犯 的 错误 。 这 对 我 们 理解 概率 法 则 大 有 神 益 。 令 人 菲 夷 所 思 的 
是 ， 对 一 件 事情 解释 得 越 详细 ， 其 可 信和 度 越 低 。 如 果 要 让 自己 值得 信赖 ， 那 就 尽 
量 避 免 细 节 化 。 

最 后 一 项 法 则 就 是 加 法 法 则 ， 两 个 事件 中 任何 一 个 事件 发 生 的 概率 为 两 个 事 
件 单独 发 生 的 概率 之 和 。 但 是 这 一 法 则 只 有 在 两 个 事件 不 能 同时 发 生 的 情况 下 才 
适用 (术语 称 这 两 个 事件 为 互 斥 事件 ) 。 用 公式 表达 这 一 法 则 为 

P(4 或 B) =P(4) +P(B) 
例如 ， 假 设 掷 仙 子 得 到 数字 为 6 是 事件 4， 得 到 数字 为 奇数 是 事件 B。 这 两 










































































@ ”我 想 在 此 说 明 经 济 学 奖 并 非 是 真正 意义 上 的 诺 贝尔 奖 ， 因 为 在 阿尔 弗 雷 德 ， 诺 贝尔 的 遗嘱 里 并 没 
有 设立 这 个 奖项 。 这 个 奖项 是 在 1969 年 开始 设立 颁发 的 ， 它 的 正式 名 称 是 “瑞典 国家 银行 纪念 
阿尔 弗 雷 德 ， 诺 贝尔 经 济 学 奖 ”。 特 此 说 明 以 便 读 者 了 解 。 
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个 事件 就 是 互 斥 事件 ， 因 为 你 不 可 能 括 一 次 骨 子 同时 得 到 数字 6 和 奇数 。 掷 一 次 
货 子 这 个 前 提 很 重要 ， 因 为 你 完全 可 以 先 搓 出 6 然后 再 掷 一 次 得 到 一 个 奇数 。 利 
用 上 述 公 式 可 以 算出 撞 一 次 仍 子 得 到 数字 6 或 奇数 的 概率 是 1/6 +3/6 =4/6。 

约翰 艾 伦 . 保罗 斯 在 他 的 畅销 书 《 数 学 育 》(《Innumeracy》) 中 描绘 了 一 个 
他 杀身 经 历 的 小 故事 :当地 的 一 位 气象 预报 员 这 样 调 侃 天 气 “ 周 六 有 50% 的 降水 
概率 ， 周 日 有 50% 的 降水 概率 ， 因 此 周末 的 降水 概率 为 100% ”。 这 一 说 法 明显 
是 非常 荒 廖 的 ， 但 是 错 在 哪儿 呢 ? 原来 是 错误 地 使 用 了 加 法 法 则 。 星 期 六 下 雨 并 
没有 排除 星期 天 下 雨 的 情况 ， 这 两 个 事件 完全 可 以 都 发 生 。 在 这 种 情况 下 ， 有 一 
个 修正 版 的 加 法 法 则 可 以 运用 。 首 先 你 需要 把 这 两 个 事件 发 生 的 概率 相 加 ， 然 后 
减 去 两 个 事件 同时 发 生 的 概率 。 用 公式 可 表达 为 

P(A 或 B) =P(4) +P(B) -P(4 与 万 ) 

如 果 4 和 B 不 能 同时 发 生 ， 则 P(4 与 B) =0。 那 么 在 这 个 特殊 情况 下 我 们 
就 可 以 得 到 加 法 法 则 了 。 如 果 我 们 用 事件 4 来 表示 周 六 会 下 雨 ， 用 事件 B 来 表示 
周 日 会 下 雨 ， 事件 (4 与 B) 表示 两 天 都 会 下 雨 。 那 么 要 计算 周末 有 两 的 概率 ， 
我 们 把 50% 加 上 50% ， 得 到 100% ， 然 后 我 们 还 必须 要 减 掉 两 天 都 下 雨 的 概率 。 
不 管 两 天 都 下 雨 的 概率 是 多 少 ， 它 一 定 会 大 于 0， 因 此 我 们 最 后 得 到 周末 有 十 的 
概率 一 定 小 于 100% 。 常 识 也 告诉 我 们 这 一 结论 。 我 只 是 好 奇 ， 如 果 每 天 下 十 的 
概率 都 是 75% ， 那么 天 气 预报 员 认 为 周末 有 雨 的 概率 该 是 多 少 。 



































图 1-4 所 示 的 样本 空间 包含 了 拨 两 次 贷 
子 可 能 出 现 的 36 种 情况 。 事 件 “ 第 一 次 搬出 
4” 和 事件 “第 二 次 搬出 4” 已 经 被 标 出 来 
了 。 你 已 经 注意 到 了 这 两 个 事件 都 有 6 种 可 
能 情形 ， 最 终 两 个 事件 共有 11 种 可 能 情况 ， 
因为 有 一 种 可 能 情形 在 两 个 事件 中 都 会 出 现 。 











图 1-4 掷 两 次 货 子 出 现 的 情况 


让 我 们 用 掷 蜗 子 的 例子 来 验证 这 一 公式 。 如 果 你 掷 两 次 内 子 ， 那 么 至 少 有 一 
次 搓 出 4 的 概率 是 多 少 ? 在 这 个 例子 中 ， 相 关 的 事件 为 事件 4“ 第 一 次 掷 出 4”， 
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事件 下 “第 二 次 掷 出 4”。“ 至 少 有 一 次 掷 出 4” 的 事件 为 “4 或 B”。 依 据 图 1-4 
可 知 ， 这 一 概率 为 11/36。P(4) 的 概率 为 6/36，P(B) 的 概率 为 6/36， 因 为 两 
次 都 出 现 4 的 情况 只 有 一 种 ， 即 P(4 与 B) 的 概率 为 1/36。6 +6-1=11， 因 此 
这 个 公式 是 正确 的 。 

不 管 每 个 事件 的 概率 是 多 少 ， 都 必须 在 不 违背 上 述 法 则 的 前 提 下 进行 。 你 可 
以 随机 问 一 位 朋友 ， 周 六 下 雨 、 周 日 下 雨 、 两 天 都 下 雨 、 至 少 一 天 下 雨 的 概率 分 
别 是 多 少 。 你 将 会 得 到 4 个 数字 ， 这 4 个 数字 必须 符合 我 们 刚才 所 讨论 的 公式 。 
例如 ， 有 人 会 认为 周 六 下 雨 的 可 能 性 非常 大 ， 比 如 有 70% ， 周 日 也 是 一 样 的 可 
能 性 。 两 天 都 下 雨 的 概率 呢 ?” 也 许 是 50% 吧 。 假设 最 后 一 个 事件 的 概率 是 80% 。 
这 些 随 机 确定 的 概率 违背 了 加 法 法 则 ， 因 为 结果 80% 并 不 等 于 70% +70% - 
50% =90% 。 男 一 个 人 可 能 会 随口 说 出 一 些 概 率 (以 相同 的 顺序 ) : 70% 、60% 、 
80% 、50% 。 这 些 概率 的 确 符 合 了 加 法 法 则 ， 但 是 却 存在 另外 一 个 问题 。 你 知道 
是 什么 吗 ? (提示 一 下 ， 布 罗 德 太太 也 许 会 知道 。) 

让 我 们 继续 讨论 周末 的 天 气 。 假 设 周 六 、 周 日 下 雨 的 可 能 性 分 别 都 是 0. 5， 
两 天 都 下 雨 的 概率 为 p(p 的 值 介 于 0 和 1 之 间 ， 不 是 百分数 的 形式 ) 。 那 么 bp 的 
取 值 区 间 是 什么 呢 ? 周末 有 雨 的 概率 是 如 何 取决 于 P 的 呢 ? 

假设 将 事件 4 和 B 分 别 定义 为 “ 周 六 下 雨 ” 和 “ 周 日 下 雨 ”"。 那 么 周末 至 少 一 
天 有 两 的 事件 为 “4 或 B”， 因 为 p=P(4 与 了) ， 我 们 可 以 得 到 下 面 这 个 等 式 : 

P(4 或 B) =P(4) +P(B)-P(4 与 B) =1-p 

又 因为 p 必须 小 于 P(4) 和 P(B)，, 它 不 可 能 超过 0.5。 如 果 p 为 0， 则 
P(A 或 B) =1， 那么 周末 肯定 会 下 雨 。 如 果 的 取 值 范围 为 0 ~0.5， 那 么 周末 下 
雨 的 概率 降 到 了 0. 5 ~1。 为 什么 会 这 样 呢 ? 这 与 周 六 周 日 同时 下 雨 的 概率 有 关 。 
一 年 有 52 个 周末 ， 平 均 来 说 26 个 周 六 会 下 雨 ，26 个 周 日 会 下 雨 。 如 果 了 为 0， 
这 就 意味 着 周 六 不 下 雨 ， 周 日 一 定 会 下 雨 。 因 此 ，26 个 下 雨 的 周 六 和 26 个 下 雨 
的 周 日 必须 分 开 ， 不 能 同时 出 现在 一 个 周末 。 要 出 现 这 种 可 能 性 意味 着 每 个 周末 
恰好 只 有 一 天 下 雨 。 当 p 的 取 值 越 来 越 大 ， 周 末 两 天 都 下 雨 的 可 能 性 越 来 越 大 ， 
最 极端 的 例子 就 是 当 p 为 0.5 的 时 候 。 所 有 的 下 雨天 都 集中 在 一 起 了 ， 一 年 中 半 
年 的 周末 全 都 在 下 雨 ， 男 外 半年 的 周末 全 都 是 晴天 。 

接 下 来 做 个 小 练习 。 把 所 有 事件 的 概率 都 换 一 下 , 令 P(4) 为 0.6, P(B) 
为 0.7，P(4 与 B) 为 p。 解 释 一 下 为 什么 p 的 取 值 区 间 为 0.3 ~0.6。 
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的 1.4 独立 性 : 对 空难 的 解释 


世界 上 每 时 每 刻 都 在 发 生 着 随机 事件 ， 大 多 数 情 况 下 它们 之 间 没 有 任何 联 
系 。 比 如 你 扔 一 枚 硬币 ， 我 斤 一 次 骨 子 ， 不 论 我 撕 出 来 的 数字 是 多 少 ， 你 得 到 硬 
币 正 面 朝 上 的 概率 都 为 1/2。 又 如 如 果 明 天 降雨 的 概率 是 20% ， 那 么 也 不 会 改变 
流感 是 否 会 在 亚洲 爆发 。 再 比方 说 美国 股市 股指 的 变化 不 会 影响 温 布 尔 登 网 球 公 
开赛 谁 问 易 夺 冠 。 这 些 相互 没有 关联 的 事件 称 为 独立 事件 。 要 计算 两 个 独立 事件 
发 生 的 概率 非常 简单 ， 只 需 将 两 者 各 自发 生 的 概率 相 乘 即 可 。 我 们 把 这 种 计算 方 
法 称 为 乘法 法 则 ， 用 公式 表述 即 为 

P(A 与 B) =P(4) xP(B) 

这 个 公式 可 以 从 正 反 两 个 方面 来 运用 。 如 果 两 个 事件 是 相互 独立 的 ， 那 么 可 
以 用 乘法 法 则 来 计算 两 事件 同时 发 生 的 概率 。 反 之 ， 如 果 乘 法 法 则 适用 于 两 个 事 
件 同时 发 生 的 概率 运算 ， 那 么 这 两 个 事件 必然 是 相互 独立 的 。 要 证 明 这 一 用 法 为 什 
么 正确 需要 经 过 相当 详细 严谨 的 过 程 ， 我 们 用 几 个 简单 的 例子 来 说 明 这 个 公式 和 
直觉 是 一 致 的 。 我 们 继续 用 上 面 的 例子 ， 你 扔 一 枚 硬币 ， 然 后 我 掷 一 次 山子 。 显 
然 共 有 12 种 可 能 出 现 的 结果 : (H, 1), …, (H, 6), (7, 1), …, (7, 6)。 
那么 硬币 正面 向 上 ， 骨 子 数字 为 6 的 概率 是 多 少 呢 ? 显然 是 1/12。 正 面向 上 的 概 
率 为 1/2 ， 般 子 数字 为 6 的 概率 为 1/6 ， 两 者 相 乘 得 出 结果 为 1/12。 

接 下 来 我 们 举 另 外 一 个 例子 。 从 一 副 扑 克 牌 中 抽出 一 张 牌 ， 现 在 考虑 两 个 事 
件 ， 事 件 4: 这 张 牌 为 A; 事件 五 ， 这 张 牌 为 红 桃 。 它 们 是 相互 独立 的 吗 ? 让 我 
们 用 乘法 法 则 来 检验 吧 。 这 两 个 事件 分 别 的 概率 为 

P(A) =4/52 =1713 
P(H) =13/52 =1/4 

事件 4 和 事件 五 同时 发 生 的 概率 即 抽 出 的 这 张 牌 为 红 桃 A 的 概率 为 1/52， 
它 是 1/13 与 1/4 的 乘积 。 在 这 个 例子 中 , P (4 与 有 ) =P(4) xP(H)， 这 意味 
着 这 两 个 事件 是 相互 独立 的 事件 。 现 在 从 这 副 牌 中 拿 出 黑 桃 2， 重 新 洗 牌 ， 然 
后 再 考虑 上 述 两 个 事件 。 它 们 还 是 互相 独立 的 吗 ? 应 该 是 吧 ? 毕竟 ， 黑 桃 2 跟 红 
桃 或 是 A 没有 任何 关系 。 此 时 分 别 计 算 这 两 个 事件 的 概率 ， 现 在 总 共有 51 张 牌 ， 
因此 ， 
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P(A) =4/51 
P(H) =13/51 

那么 P(4 与 有 8) =1/51。 此 时 P(A4 与 万 ) 不 等 于 P(4) 与 P(H8) 的 乘积 ， 
这 也 就 意味 着 这 两 个 事件 再 也 不 是 独立 的 了 。 为 什么 呢 ? 当 我 们 把 黑 桃 2 从 牌 堆 
里 拿 走时 ， 牌 4 出 现 的 概率 从 4/52， 变 成 了 4/51, 但 4 的 花色 为 红 桃 出 现 的 概 
率 并 没有 改变 ， 依 然 是 1/13 =4/52。 让 我 们 回 到 独立 事件 的 概念 ， 即 一 个 事件 的 
发 生 不 会 改变 另外 一 个 事件 发 生 的 概率 。 在 上 述 的 例子 中 ， 如 果 事 件 五 发 生 了 ， 
那么 事件 4 发 生 的 概率 会 从 4/51 变 为 1/13。 

我 通常 会 在 介绍 了 事件 独立 性 之 后 问 学 生 : 如 果 两 个 事件 不 能 同时 发 生 ， 那 
么 它们 一 定 互相 独立 吗 ? 乍 一 听 你 肯定 会 这 样 认为 。 毕 竟 它 们 之 间 没 有 任何 关 
系 ， 对 四” 错 ! 它们 之 间 有 千 丝 万 缕 的 联系 。 如 果 一 个 事件 发 生 了 ， 我 们 即 可 以 
确定 另外 一 个 事件 不 会 发 生 。 掷 货 子 得 到 数字 6 的 概率 是 1/6， 但 是 当 我 告诉 你 
结果 一 定 是 奇数 时 ， 这 个 概率 就 下 降 为 0 了。 仔细 想 想 这 个 问题 。 这 对 于 理解 独 
立 性 至 关 重 要 。 

1992 年 12 月 ， 一 架 小 型 客机 在 瑞典 斯 德 哥 尔 摩 靠 近 布 罗马 机 场 的 居民 区 荃 
落 ， 所 幸 没 有 造成 任何 居民 的 伤亡 。 但 这 使 已 经 饱 受 交 通 拥堵 和 机 场 扩张 折磨 的 
居民 们 又 多 了 一 个 顾虑 。 为 了 平 丘 民众， 机场 总 经 理 在 接受 电视 采访 时 说 道 ， 
“从 统计 学 上 说 人 们 应 当 感 到 更 安全 ， 因 为 再 发 生 一 次 事故 的 概率 相 比 之 前 已 经 
小 得 多 了 ”。 当 时 我 作为 一 名 研究 生 ， 在 瑞典 学 习 概 率 和 统计 学 。 当 我 听 到 “从 
统计 学 上 说 ”和 “概率 ”这 两 个 词 在 同一 句 话 中 被 如 此 随意 地 使 用 时 ， 我 觉得 
非常 的 滑稽 。 作 为 一 个 热血 青年 ， 我 立刻 写 信 给 瑞典 的 一 家 报社 ， 解 释 为 什么 这 
个 机 场 经 理 的 话 是 错 的 ， 这 封 信和 最 后 也 被 刊登 出 来 了 。 在 信 中 我 建议 那 位 接受 采 
访 的 经 理 联系 我 ， 以 便 我 给 他 推荐 一 本 好 的 概率 书 。 当 然 ， 最 终 我 没有 收 到 他 的 
回信 。 

这 位 机 场 经 理 犯 的 错误 相当 普遍 : 他 混淆 了 一 个 事件 发 生 两 次 的 概率 与 一 件 
事 再 次 发 生 的 概率 。( 扔 两 次 硬币 ， 两 次 都 是 正面 朝 上 的 概率 是 多 少 ? 1/4。 一 直 
扔 硬币 直到 正面 朝 上 ， 那 么 你 下 一 次 扔 到 正面 朝 上 的 概率 是 多 少 呢 ?1/2， 因 为 
这 两 个 事件 是 独立 的 。) 把 扔 硬币 换 成 从 布 罗马 机 场 起 飞 和 降落 的 飞机 ， 硬 币 正 
面 朝 上 的 概率 换 成 飞机 失事 的 概率 。 那 么 你 就 会 知道 为 什么 这 个 机 场 总 经 理 的 话 
是 错 的 。 他 唯一 可 能 的 辩解 就 是 飞机 失事 并 非 独 立 的， 一 次 事故 之 后 会 启动 调查 
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从 而 提高 安全 性 。 或 许 如 此 ， 但 是 这 并 没有 成 为 他 的 论据 ， 他 相信 的 是 纯粹 概率 
的 戏法 。 其 次 ， 即 使 是 有 这 样 的 调查 ， 它 也 不 会 使 男 一 起 事故 发 生 的 概率 又 减 。 
毕竟 引发 事故 的 原因 各 不 相同 。 这 些 事件 都 不 是 独立 的 ， 但 是 差别 并 不 大 。 拿 我 
们 前 面 举 过 的 那个 从 一 副 牌 中 取出 黑 桃 2 的 例子 来 说 ， 抽 到 A 的 事件 和 抽 到 红 桃 
的 事件 并 非 完 全 独立 。 前 者 的 概率 是 4/51， 差 不 多 是 0.078 ， 而 在 我 们 已 知 抽 到 
的 牌 是 红 桃 时 那么 这 张 牌 是 A 的 概率 为 1/13 ， 大 概 是 0.077， 并 没有 很 大 的 差 
别 。 这 些 事件 几乎 可 以 视 为 独立 的 。 

我 曾 在 一 党 概率 课 上 说 即使 你 已 经 连续 扔 九 次 硬币 都 是 正面 朝 上 ， 你 下 一 次 
扔 硬币 得 到 正面 朝 上 的 概率 跟 它 朝 下 的 概率 还 是 一 样 的 。 下 课 之 后 有 一 名 学 生 非 
常 疑惑 地 问 我 这 怎么 可 能 呢 。 毕 竟 ， 连 续 十 次 正面 都 朝 上 的 概率 太 小 了 。 我 首先 
回答 它 硬 币 是 没有 记忆 的 。 当 你 开始 扔 它 的 时 候 ， 你 需要 知道 之 前 扔 的 是 这 枚 硬 
币 吗 ， 之 前 是 哪 一 面 朝 上 吗 ? 当然 不 需要 。 这 名 学 生 对 此 没有 异议 ,但 是 仍然 坚 
持 认为 连续 十 次 都 扔 出 正面 朝 上 的 概率 太 小 了 ， 这 跟 我 的 理论 完全 不 符 。 虽 然 在 
连续 十 次 都 扔 出 正面 朝 上 的 概率 非常 小 这 一 点 上 他 是 对 的 〈 这 一 事件 发 生 的 概率 
是 1/1024， 比 千 分 之 一 还 要 小 ) ， 但 是 这 跟 我 所 说 的 扔 完 九 次 正面 朝 上 再 扔 一 次 
正面 仍然 朝 上 的 概率 完全 没有 关系 。 如 果 他 连续 十 次 扔 硬币 ， 他 前 九 次 扔 硬币 
连续 九 次 正面 朝 上 是 512 种 不 同 的 情况 中 的 一 种 ， 第 十 次 继续 得 到 正面 朝 上 有 
一 半 的 概率 。 连 续 十 次 正面 朝 上 的 概率 是 1/1024， 连 续 九 次 正面 朝 上 之 后 第 十 
次 再 正面 朝 上 的 概率 依然 是 1/2。 并 不 是 只 有 这 个 机 场 经 理 和 大 学 生 在 这 个 问 
题 上 犯错 。 这 样 的 错误 非常 常见 ， 在 后 文中 我 将 对 此 进行 仔细 地 讲解 。 

假设 你 和 你 的 堂 妹 乔 伊 打 算 用 扔 硬币 的 方法 来 解决 你 们 之 间 的 矛盾 ， 但 是 你 
们 两 个 人 都 没有 硬币 。 于 是 乔 伊 建议 用 扔 瓶 盖 来 代替 扔 硬币 ， 瓶 盖 正面 朝 上 相当 
于 硬币 正面 朝 上 ， 反 之 就 是 硬币 的 反面 。 但 是 你 不 能 保证 这 两 个 事件 的 概率 是 否 
相等 ， 有 什么 方法 能 够 保证 结果 的 公平 性 吗 ? 

计算 机 之 父 一 一 约翰 汉 . 诺 依 曼 有 一 个 不 错 的 主意 值得 效仿 ， 窒 门 是 你 可 
以 要 求 掷 两 次 瓶 盖 而 非 一 次 。 如 果 投 掷 的 结果 是 HT， 那 么 你 赢 ， 如 果 投 掷 的 结 
果 是 TH， 那么 乔 伊 赢 。 如 果 结 果 是 HH 或 是 TT 则 为 平局 ， 重 新 开始 掷 瓶 盖 。 假 
设 正面 朝 上 的 概率 为 p， 并 不 一 定 是 1/2。 那 么 反面 朝 上 的 概率 为 1 -p， 独 立 性 
使 得 事件 HT 发 生 的 概率 为 p x (1 -p)， 得 到 TH 的 概率 是 (1 -p) xp。 实 际 上 ， 
两 者 的 概率 是 相同 的 。 这 样 就 可 以 保证 程序 的 公正 性 了 (但 是 如 果 这 时 p 的 概率 
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非常 接近 0 或 者 1， 游戏 就 要 玩 很 久 才能 分 出 胜 负 了 ) 。 

对 于 多 个 独立 事件 来 说 ， 乘 法 法 则 依然 是 适用 的 。 假 设 事件 4、B、C 都 相 
互 独立 ， 那么 P(4 与 B) =P(4) xP(B)， 同 样 事件 (4 与 C) 与 事件 (8B 与 C) 
也 成 立 。 三 个 事件 同时 发 生 的 概率 为 P(4 与 B 与 C) =P(4) xP(B) xP(C)。 对 
于 三 个 事件 来 说 ,情况 会 复杂 一 些 。 下 面 的 例子 就 说 明了 单独 两 个 事件 互相 独立 
是 不 够 的 。 我 将 会 放手 让 你 自己 来 完成 这 道 题 。 你 掷 了 两 次 硬币 ， 然 后 考虑 以 下 
三 个 事件 : 

4: 第 一 次 正面 朝 上 
B: 第 二 次 正面 朝 上 
C: 第 一 次 和 第 二 次 结果 不 同 

这 三 个 事件 两 两 相互 独立 ,但 是 C 相对 于 事件 (4 与 B) 来 说 并 不 是 独立 
的 ， 使 得 乘法 法 则 在 此 处 不 再 适用 。 值 得 注意 的 是 ， 在 此 处 单独 事件 4 与 事件 C 
并 无 任何 关系 ， 同 样 单独 事件 与 事件 C 也 无 任何 关系 。 但 是 这 不 能 保证 事件 
(4 与 B) 与 事件 C 没有 关系 。 

如 果 你 想 要 计算 至 少 一 个 非 独 立 事件 发 生 的 概率 ， 那 么 上 一 节 中 提 到 的 第 一 
法 则 在 这 里 就 发 挥 作用 了 。 首 先 计 算 所 有 事件 都 不 发 生 的 概率 ， 然 后 再 用 1 减 去 
它 。 例 如 ， 在 嘉年华 “ 碰 运 气 ” 游 戏 中 ,你 投 找 三 颗 骨 子 其 中 至 少 一 颗 点 数 为 
6， 那 么 你 将 赢得 游戏 。 你 赢 的 概率 是 多 少 呢 ? 一 颗 山 子 掷 6 的 概率 是 1/6， 你 有 
三 次 机 会 ， 也 许 你 认为 你 有 一 半 赢 的 机 会 。1/6 乘 以 3 当然 等 于 1/2。 但 是 这 跟 
我 们 现在 叙述 的 问题 没有 任何 联系 。 如 果 你 按照 刚才 我 给 出 的 建议 ， 先 算出 没有 
一 次 结果 为 6 的 概率 。 依 据 独立 性 原理 ， 概 率 为 

P(3 次 均 非 6) =5/6 x5/6 x5/6=(5/6)” 

于 是 我 们 得 出 P( 至 少 一 次 为 6) =1 - (57/6) =0.42 

每 次 游戏 中 你 付 钱 才能 玩 ， 所 以 你 输 的 概率 比 赢 的 大 。 如 果 是 搓 四 颗 仍 子 
呢 ? 你 赢 的 概率 为 1 - (5/6)*， 大 约 为 0.52。 因 此 在 撕 四 颗 骨 子 的 情况 下 ， 你 才 
有 优势 。 

再 举 一 个 例子 。 美 式 轮 盘 上 的 数字 从 1 到 36， 另 外 再 加 上 数字 0 和 数字 00。 
如 果 你 在 一 个 数字 上 下 注 ， 你 赢 的 概率 是 1/38。 你 要 玩 多 少 轮 才 能 保证 至 少 启 
一 次 的 概率 达到 一 半 呢 ? 是 19 轮 吗 (38 的 一 半 )? 现在 假设 这 个 数字 是 n。 那 么 
我 们 得 到 了 等 式 
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已 〈 至 少 顾 一 次 ) =1 - (377/38) 
当 n 等 于 19 时 ,概率 只 是 0.4。 当 nn 等 于 25 时 ， 概 率 约 等 于 0.49， 当 并 等 
于 26 时 ， 概 率 刚 过 半 。 因 此 ， 你 需要 玩 26 轮 。38 除 以 2 得 19 肯定 是 对 的 ， 但 
是 它 与 游戏 并 不 相关 .9 数字 19 男 有 用 处 。 如 果 你 在 一 轮 游戏 中 赌 了 19 个 数字 ， 
那么 你 有 一 半 的 概率 能 赢 。 当 然 ， 你 只 是 赢 一 次 。 然 而 你 如 果 一 直 只 赌 一 个 数 
字 ， 你 可 以 赢 很 多 次 。 下 文 将 会 解释 ， 从 长 远 来 看 ， 不 管 你 怎么 玩 这 个 游戏 你 都 
是 会 输 的 。 这 是 多 么 不 幸 啊 ! 





1.5 条 件 概率 : 电视 抽奖 与 萨 利 案 


如 果 两 个 事件 不 是 互相 独立 的 ,那么 它们 称 为 “如 果 … 则 …” 相关 的 。 如 
果 两 个 事件 是 相关 事件 ， 那 么 一 个 事件 发 生 的 概率 会 随 着 男 一 个 事件 发 生 与 否 而 
改变 。 找 骨 子 找 到 6 的 概率 是 116。 如 果 我 告诉 你 投掷 的 结果 是 一 个 偶数 ， 那 么 
你 就 可 以 排除 1、3、5 这 三 种 情况 了 。 这 时 掷 到 6 的 概率 是 1/3。 我 们 预先 知道 
了 掷 出 的 结果 是 偶数 ， 再 计算 搓 出 6 的 概率 ， 这 种 情况 也 就 是 条 件 概率 。 我 在 上 
文 曾经 提 过 可 以 用 概率 来 思考 平均 长 期 行为 的 问题 。 同 样 ， 我 们 也 可 以 用 条 件 概 
率 来 看 待 长 期 行为 ; 你 只 需要 忽略 所 有 不 符合 这 个 条 件 的 行为 。 比 如 在 上 面 例子 
中 ， 你 只 需要 忽略 所 有 奇数 结果 ， 计 算 6 出 现在 偶数 结果 的 概率 ， 你 就 可 以 得 出 
1/3 这 个 结果 。 对 于 条 件 概率 我 们 可 以 运用 乘法 公式 来 表达 ， 对 于 任意 事件 4、 
B,， 有 























P(A4 与 B) =P(A) xP(BIA) 
换言之 ， 如 果 事 件 4、B 要 同时 发 生 ， 则 首先 要 得 出 事件 4 发 生 的 概率 ， 然 
后 再 计算 在 4 已 发 生 的 前 提 下 事件 如 发生 的 概率 。 当 运用 到 这 个 公式 时 ， 你 可 以 
自己 选择 将 一 个 事件 定义 为 4， 另 一 个 事件 定义 为 已 。 现 在 假设 你 从 一 副 牌 里 抽 
出 两 张 牌 ， 两 张 都 是 A 的 概率 为 多 少 ? 令 第 一 张 是 A 为 事件 4， 则 P(4) 为 








G@ 这 让 我 想起 了 一 个 有 趣 的 小 故事 。 一 个 乘 着 热气 球 的 男人 迷路 了 ， 他 问 地 面 上 的 另 一 个 人 他 在 
里 。 这 个 地 面 上 的 人 回答 他 说 :“ 你 在 热气 球 上 。 “也 就 是 我 这 么 倒霉 , ” 坐 在 热气 球 上 的 这 个 细 
人 抱怨 道 ,“ 偏 偏 问 了 一 个 数学 家 。“ 你 怎么 知道 我 是 数学 家 ?” 地 面 上 这 个 男人 问 道 。 他 回答 道 : 
“你 的 答案 是 正确 的 ， 但 是 毫 无 用 处 。” 
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4/5$2 。 因 为 已 经 出 现 一 张 A 了 ， 剩 下 的 51 张 牌 中 只 剩 下 三 张 A。 因 此 令 第 二 
张 是 A 的 概率 为 3/51， 即 P(B14) 等 于 37Z51。 将 两 个 概率 相 乘 ， 得 到 的 结果 
约 等 于 0. 0045 。 

当 你 在 对 比 这 两 种 乘法 法 则 时 ， 你 会 发 现在 独立 事件 中 P(B) =P(BI4)， 
事件 4 的 发 生 与 否 不 会 改变 事件 B 发 生 的 概率 。 这 个 发 现 非常 有 意义 。 稍 微 改 
变 一 下 上 面 的 例子 ， 第 一 次 抽出 一 张 牌 之 后 将 牌 放 回去 ， 重 新 洗 牌 ， 再 抽 一 次 
牌 。 现 在 两 张 都 是 A 的 概率 是 多 少 ? 在 这 种 情况 下 ， 两 次 抽 到 A 的 事件 是 独立 
的 ， 概 率 为 4/52 乘 4/52， 大 约 是 0.0059 (为 什么 得 出 的 结果 会 比 0.0045 大 呢 ? 
想 想 你 抽 三 次 、 四 次 、 五 次 得 到 的 牌 都 是 A 的 概率 是 多 少 吧 ) 。 

如 果 P(B 14) 不 等 于 P(B) ， 则 P(418) 也 不 等 于 P(4)。 这 看 起 来 有 着 一 定 
的 对 称 性 。 事 件 (4 与 B) 与 事件 (8B 与 4) 是 一 样 的 ， 你 可 以 用 上 述 的 乘法 公 
式 来 证 明 。 尤 其 是 注意 到 当 无 法 直接 计算 出 条 件 概 率 时 ， 通 常会 用 乘法 公式 去 计 
算 。 通 过 变形 ， 可 以 得 出 

P(BIA) =P(A 与 B)/ P(A) 

这 一 公式 在 以 后 会 有 大 用 。 提 醒 大 家 注意 P(4 与 也) 表示 的 是 事件 4、B 同 
时 发 生 的 概率 ， 而 P(B14) 是 指 当 事 件 4 已 经 发 生 了 ,事件 B 发 生 的 概率 。 这 两 
种 概率 意义 完全 不 同 。 随 机 选择 一 个 美国 人 ， 令 事件 4 为 “此 人 来 自 于 罗 德 岛 
州 ”， 令 事件 有 为 “此 人 是 葡萄 牙 后 裔 "”。P(4 与 B) 表示 这 个 人 来 自 罗 德 岛 州 
且 有 葡萄 牙 祖先 的 概率 ， 大 概 有 0.03% (在 美国 两 亿 九 千 五 百 万 人 口中 ， 大 概 
有 九 万 人 符合 这 样 的 特征 )。 而 条 件 概率 P(B14) 则 指 的 是 一 个 罗 德 岛 州 人 拥有 
葡萄 牙 的 祖先 的 概率 ， 这 一 概率 大 概 是 9% ( 罗 德 岛 州 一 百 万 人 口中 有 九 万 人 拥 
有 葡萄 牙 血 统 ) 。 

为 了 方便 理解 如 何 计算 条 件 概率 ， 我 们 再 一 次 用 到 掷 两 次 仍 子 的 例子 。 
令 事 件 4 为 至 少 掷 出 一 个 6， 令 事件 有 为 两 次 结果 之 和 为 10 。 人 参见 图 1-5 的 
样本 空间 ， 标 记 为 4 的 事件 指 的 是 至 少 一 次 掷 出 6; 标记 为 B 的 事件 指 的 是 
两 次 结果 之 和 为 10。 有 两 种 情况 可 以 使 4、B 同时 成 立 〈 第 一 次 掷 出 4， 第 
二 次 掷 出 6 或 者 第 一 次 掷 出 6， 第 二 次 掷 出 4)， 因 此 P(4 与) =2/36。 通 
过 图 1-5 可 知 P(4) =11Z36， 因 此 利用 公式 可 以 计算 出 掷 出 一 个 6 后 两 次 结 
果 为 10 的 概率 是 

P(BIA) =P(A 与 B)/ P(A) =2/36 :11/36=2/11, 
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图 1-5 撕 两 次 般 子 的 样本 空间 


当然 你 也 可 以 直观 地 来 理解 这 一 问题 ， 如 果 掷 出 了 一 个 6， 剩 下 还 有 11 种 可 

能 的 结果 ， 而 其 中 有 两 种 情况 相 加 之 和 为 10， 因 此 条 件 概 率 为 2/11。 如 果 你 的 
觉 不 错 的 话 ， 那 么 计算 的 结果 和 直观 的 结果 总 是 一 致 的 。 

在 20 世纪 90 年 代 初 ， 一 家 瑞典 知名 的 报纸 利用 “你 的 彩票 都 被 扔 了 !” 这 
一 标题 引起 了 很 大 的 骚动 。 这 与 当时 的 流行 电视 节目 “ 宾 戈 乐 透 ” 有 关 。 人 们 
买 乐 透 彩 票 然 后 寄 给 节目 组 ， 主 持 人 在 现场 直播 时 从 大 邮 袋 中 抽出 一 张 彩票 ， 宣 
布 中 奖 。 一 些 细心 的 记者 发 现 ， 这 个 大 邮 袋 中 只 有 小 部 分 寄 来 的 彩票 。 因 此 得 出 
一 个 结论 : 你 的 彩票 被 扔 掉 了 1 

让 我 们 来 快速 地 解决 这 个 问题 吧 。 假定 总 共有 十 万 张 彩票 ， 随 机 选择 了 一 干 
张 来 进行 最 后 的 抽奖 。 如 果 从 全 部 的 彩票 中 抽奖 ， 你 中 奖 的 概率 是 十 万 分 之 一 。 
按照 节目 组 的 方法 ， 你 的 彩票 首先 要 从 第 一 轮 随机 抽取 被 放 进 邮 袋 ， 然 后 再 第 二 
轮 从 邮 袋 中 被 抽 中 。 你 的 彩票 可 以 被 放 入 邮 袋 的 概率 是 百 分 之 一 。 当 你 的 彩票 
经 在 邮 袋 中 ， 再 次 被 抽 中 中 奖 的 概率 是 千 分 之 一 。 两 个 概率 相 乘 ,得 到 的 是 十 万 
分 之 一 。 明 白 了 这 一 点 ， 观 众 就 不 会 骚乱 了 。 

用 条 件 概 率 也 可 以 解释 为 什么 在 1.3 节 的 例子 中 ， 蒂 波多 太太 会 说 : 
“这 听 起 来 更 允 真 呢 。” 她 根本 没有 意识 到 自己 用 了 条 件 概率 。 她 无 法 想象 一 
位 前 州 议 员 会 沦落 到 衣衫 袜 实 的 境地 。 当 她 了 解 到 他 的 经 历时 ， 她 才 开 始 相 
言 。 因 此 ， 她 认为 P(B14) 比 P(B) 更 大 (你 知道 事件 4 和 事件 B 分 别 是 什 
么 吗 ? ) 。 

在 理解 概率 问题 上 产生 的 雇 误 远 比 激怒 瑞典 的 电视 观众 或 取消 路 易 斯 安 那 的 
政客 更 为 严重 。 问 问 萨 利 . 克拉 克 吧 ， 她 最 清楚 。1999 年 ， 英 国 陪审 团 认为 她 
谋杀 了 她 的 两 个 孩子 。 两 个 孩子 分 别 在 出 生 后 8 周 和 11 周 时 独 死 。 一 位 儿科 医 






































第 1 章 计算 可 能 性 : 算 对 了 还 是 算 错 了 


生 以 专家 证 人 的 身份 出 席 庭 审 时 说 ， 一 个 家 庭 中 两 个 婴儿 狂 死 综合 征 ， 或 称 “ 婴 
儿 狸 死 ” 的 概率 只 有 七 千 三 百 万 分 之 一 。 本 案 除 此 之 外 再 无 任何 谋杀 的 人 证 物 
证 ， 也 不 存在 杀人 动机 。 唯 一 的 可 能 就 是 陪审 团 被 这 个 极 低 的 概率 说 服 了 。 但 是 
这 个 概率 是 怎么 得 到 的 呢 ? 数据 显示 在 8500 个 像 萨 利 一 样 的 家 庭 中 就 会 有 一 例 
婴儿 独 死 。 因 此 通过 简单 计算 得 出 同一 个 家 庭 中 两 个 婴儿 狸 死 的 概率 是 1/8500 x 
1/8500， 差 不 多 等 于 1/73000000。 

你 发 现 错误 了 吗 ? 我 希望 你 能 够 发 现 。 这 种 计算 方法 的 前 提 是 假设 在 同一 个 
家 庭 中 连续 狮 死 的 婴儿 是 独立 事件 。 这 个 假设 显然 是 存疑 的 ， 一 个 没有 医学 背景 
的 常人 也 自然 会 想到 存在 基因 的 问题 。 事 实 上 ， 有 统计 显示 如 果 一 个 婴儿 狸 死 ， 
那么 这 个 家 庭 其 他 的 婴儿 独 死 的 风险 更 大 ， 高 达 1/100。 要 计算 出 在 同一 个 家 庭 
中 两 个 婴儿 狸 死 的 概率 ,我们 需要 运用 到 条 件 概率 ， 即 1/8500 x 1/100， 结 果 为 
1/850000。 现 在 得 到 的 数字 依然 是 一 个 很 小 的 数字 ， 它 也 许 并 不 能 够 使 陪审 员 们 
改变 观点 。 但 是 1/850000 和 萨 利 被 判 有 罪 有 什么 关系 呢 ? 显然 毫 无 关联 。 她 第 
一 个 孩子 的 死亡 被 证 明 是 自然 原因 死亡 ， 没 有 谋杀 的 嫌疑 。 那 么 在 没有 谋杀 嫌疑 
的 前 提 下 ， 这 一 事件 再 次 发 生 的 概率 依然 是 1/100。 如 果 提 交 给 陪审 团 的 是 这 一 
数字 ， 那 么 萨 利 就 不 需要 在 判决 被 推翻 之 前 遭受 三 年 的 牢狱 之 灾 了 ， 最 后 这 个 专 
家 证 人 当然 不 是 概率 学 专家 ) 被 判 严重 渎职 

你 也 许 还 会 问 1/100 的 概率 与 萨 利 的 罪行 有 什么 关系 呢 ? 这 是 她 无 境 的 概 
率 吗 ?当然 不 是 。 如 果 是 的 话 她 意味 着 经 历 了 两 个 婴儿 狸 死 的 母亲 中 有 99% 是 
区 手 ! 1/100 仅 表 示 第 二 个 婴儿 独 死 的 概率 ， 即 经 历 了 一 次 婴儿 独 死 的 家 庭 有 
1% 的 可 能 还 要 再 承受 一 次 同样 的 打击 。 如 果 需 要 在 法 庭 上 用 概率 的 理论 ， 那 
么 所 有 参与 方 都 应 懂得 基本 的 概率 知识 。 而 在 萨 利 一 案 中 ,没有 一 个 人 懂得 概 
率 论 。 

接 下 来 ,让 我 们 来 看 一 个 悖 论 吧 ( 它 通常 并 不 以 概率 问题 的 面貌 出 现 )。 你 
的 老师 告诉 大 家 下 周 有 个 抽查 考试 ， 周 一 至 周 五 任意 一 天 的 早上 会 告诉 大 家 当天 
考试 。 你 立刻 就 会 反应 过 来 ， 这 个 考试 不 会 是 在 周 五 。 如 果 是 的 话 ， 它 就 不 是 一 
次 抽查 考试 了 ， 因 为 前 几 天 没 考试 最 后 一 天 当然 就 会 考试 了 。 于 是 ， 周 五 被 排除 
了 ， 剩 下 周一 到 周 四 。 但 是 同 理 周 四 也 不 可 能 了 ， 因 为 排除 了 周 五 它 就 是 最 后 一 
天 了 。 周 四 被 排除 了 。 接 着 周三 变 得 不 可 能 了 ， 接 着 周二 ， 接 着 周一 。 于 是 你 得 
到 这 个 结论 : 根本 就 没有 抽查 考试 这 回 事 ! 但 是 老师 在 周二 早上 告诉 大 家 当天 要 
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考试 ， 你 当时 就 震惊 了 。 

这 个 问题 通常 会 以 消防 演习 、 秘 密 处 决 的 形式 出 现 ， 它 有 许多 和 名字， 比如 
“公子 手 悖 论 ” 或 是 严肃 哲学 所 称 的 “突然 演习 悖 论 ”。 要 解决 这 一 问题 ， 我 认为 
将 其 视 为 概率 问题 这 一 步 至 关 重 要 。 我 们 假设 考试 会 在 新 的 一 周 五 个 工作 日 随机 
选 一 天 。 周 一 考试 的 概率 是 多 大 呢 ? 显然 是 1/5。 如 果 周 一 没有 考试 ， 那 么 周二 
考试 的 概率 是 多 少 ? 选中 周二 考试 的 概率 也 是 1/53 ， 但 是 我 们 现在 处 理 的 是 条 件 
概率 问题 ， 周 二 考试 的 前 提 是 周一 没有 考试 。 而 在 剩 下 的 四 天 内 周二 考试 的 概率 
变 成 了 1M4。 同 理 ， 依 据 条 件 概率 ， 在 周三 、 周 四 、 周 五 考试 的 概率 分 别 是 1/3、 
1/2 和 1。 

我 们 依据 每 天 不 考试 的 概率 用 惊奇 指数 来 定义 这 五 天 。 周 一 ， 惊 奇 指数 是 
0.8; 周二 降 到 了 0.75; 随 着 时 间 推 移 指数 越 来 越 低 。 到 了 周 五 ， 这 一 指数 就 变 
为 0， 意 味 着 周 五 一 定 会 考试 。 因 此 ， 抽 查考 试 不 是 以 等 值 的 惊奇 指数 发 生 的 ， 
当 到 了 周 五 时 你 会 自然 而 然 地 知道 今天 一 定 会 考试 。 











1.6 是 谁 在 说 谎 


这 一 节 我 们 将 讨论 一 个 经 典 的 概率 问题 ， 它 说 起 来 很 简单 ， 但 是 却 容 易 混 
淆 。 如 果 你 读 起 来 觉得 有 一 些 乏 味 ， 或 者 说 你 对 这 一 节 不 感 兴趣 ， 你 可 以 跳 过 这 
一 节 ， 直 接 进 入 下 一 节 。 这 对 你 的 阅读 完全 没有 影响 ,不 会 错过 任何 重要 的 
理论 。 

这 个 问题 的 典型 例子 就 是 ， 有 时 你 在 做 事情 之 前 必须 停 下 来 想 清 楚 别 人 要 求 
你 做 什么 。 例 如 ， 亚 达 、 鲍 勃 和 卡 罗 各 自 说 真 话 的 概率 是 1/3 (他 们 说 真 话 的 事 
件 是 独立 的 ) 。 如 果 亚 达 和 否认 了 鲍 勃 说 卡 罗 在 说 谎 ， 那 么 卡 罗 说 真 话 的 概率 是 
多 少 ? 

首先 我 们 要 明白 这 是 一 个 条 件 概率 的 问题 ， 然 后 定义 两 个 事件 : 

C: 卡 罗 说 真 话 

4: 亚 达 否认 了 鲍 勃 说 卡 罗 在 说 谎 

我 们 现在 需要 知道 的 概率 是 条 件 概率 P(C14)。 从 1.5 节 的 介绍 中 ， 我 
们 知道 要 可 以 通过 P(C 与 4) 除 以 P(A4) 来 得 到 这 一 结果 。 那 么 我 们 先 来 计 
算 P(C 与 4)。 首 先 还 是 沿用 上 文 的 假设 ,定义 事件 4 为 亚 达 否认 了 鲍 勃 说 
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卡 罗 在 说 谎 ， 因 此 事件 (C 与 4) 表示 卡 罗 说 了 真 话 ， 亚 达 说 鲍 勃 说 卡 罗 说 
了 真 话 。 现 在 问题 变 成 了 : 这 种 情况 下 到 底 是 谁 说 了 真 话 ， 谁 又 说 了 谎话 ? 
首先 ， 卡 罗 是 在 说 真 话 。 其 他 人 呢 ? 如 果 亚 达 指 证 鲤 勃 说 卡 罗 说 真 话 是 真 
话 ， 那 么 鲍 勃 也 在 说 真 话 。 因 此 ， 这 种 情况 下 三 个 人 都 在 说 真 话 ， 概 率 为 1/ 
3 x1/3 x1/3 =1727。 

如 果 亚 达 说 谎 呢 ? 那么 鲍 勃 说 卡 罗 说 谎 的 话 意味 着 鲍 勃 自己 在 说 谎 。 那 么 这 
种 情况 下 ， 亚 达 说 谎 ， 鲍 勃 说 谎 ， 卡 罗 说 真 话 也 符合 事件 的 要 求 。 它 的 概率 为 
2/3 x2/3 x1/3 =4/27。 在 亚 达 说 谎 的 前 提 下 ， 不 存在 其 他 情况 符合 事件 的 要 求 。 
用 它 加 上 之 前 计算 出 来 的 1/27 ， 我 们 可 以 得 出 P(C 与 4) =5/27。 

仅 对 于 事件 4 来 说 ， 还 有 其 他 可 能 的 情况 。 比 如 ， 亚 达 说 了 真 话 ， 而 鲍 勃 和 
卡 罗 都 说 谎 。 为 什么 呢 ? 首先 假设 亚 达 肯定 鲍 勃 说 的 卡 罗 在 说 真 话 这 句 话 是 真 
的 。 如 果 鲍 勃 在 说 假 话 ， 这 意味 着 卡 罗 也 在 说 假 话 ， 于 是 “ 亚 达 说 鲍 勃 说 的 卡 罗 
在 说 真 话 ” 这 一 事件 就 能 发 生 了 。 表 1-1 列 出 了 所 有 真 话 (T) 和 谎话 (L) 的 
结合 ， 并 说 明 是 否 符合 事件 发 生 的 要 求 。 通 过 观察 可 以 发 现 如 果 事 件 4 发 生 ， 那 
么 就 有 奇数 个 的 人 说 真 话 ， 而 事件 (C 与 4) 发 生 的 话 我 们 就 需要 再 加 上 卡 罗 说 
真 话 这 个 条 件 。 








表 1-1 三 人 说 真 话 还 是 谎话 的 所 有 可 能 情形 











亚 达 T T 再 亚 L L L L 
鲍 勃 亚 下 L L 再 T L L 
卡 罗 T L T L T L T L 
A yes no no yes no yes yes no 
C 与 4 yes no no no no no yes no 
概率 1/27 2/27 2/27 4/27 2/27 4/27 4/27 8/27 


我 们 计算 出 了 P(C 与 4) ， 通 过 上 表 可 知 P(4) 为 13/27。 通 过 条 件 概率 可 
以 算出 

P(C14) =P(C 与 4)/ P(4) =5/27 :13/27 =5/13。 这 个 概率 大 概 是 
38.5% ， 比 卡 罗 说 真 话 的 概率 33.3% 要 稍微 高 一 些 。 亚 达 确 认 饱 勃 说 卡 罗 在 说 真 
话 让 我 们 更 加 相信 卡 罗 在 说 真 话 了 ， 这 让 人 稍稍 有 些 吃惊 ， 因 为 这 群 人 可 都 是 一 
群 骗子 。 
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这 是 一 个 古老 的 问题 。 早 在 1935 年 英国 天 文物 理学 家 亚 瑟 . 爱 丁 顿 荔 士 已 
经 在 《科学 的 新 道路 》(New Pathways in Science) 一 书 中 提 及 ， 并 在 当年 的 
《数学 公报 》 (The Mathematical Gazette) 中 发 表 的 文章 中 对 这 一 问题 进行 了 深入 
的 剖析 。 他 说 这 个 问题 是 受到 了 同事 A. C. D. 克 罗 姆 林 (有 一 颗 彗 星 就 是 以 他 的 
名 字 命 名 的 ) 在 1919 年 一 次 餐 后 演说 的 启发 。 爱 丁 顿 鳃 士 的 书 中 举 的 是 四 个 人 
的 例子 ， 在 下 文中 我 也 将 会 简要 说 明 。 有 趣 的 是 ， 对 于 这 个 问题 有 人 也 提出 了 一 
些 争 议 的 观点 和 不 同 的 解法 。 差 别 之 处 源 于 我 上 文 做 出 的 一 个 重要 假设 之 前 ， 即 
如 果 亚 达 在 说 “ 鲍 勃 说 卡 罗 说 的 是 真 话 ”这 和 句 话 时 说 了 谎 ， 我 把 它 解释 成 为 饱 
勃 说 卡 罗 说 谎 。 但 是 这 句 话 也 可 以 解释 出 另 一 层 意思 一 鲍 勃 什么 都 没 说 。 事 实 
上 ， 这 个 假设 是 以 下 列 内 在 逻辑 引申 出 的 一 系列 的 推论 : 首先 卡 罗 说 了 一 些 话 ， 
既 有 可 能 是 真 话 也 有 可 能 在 说 谎 ; 接 下 来 ， 鲤 勃 知道 她 有 没有 说 真 话 ， 然 后 说 
“ 卡 罗 说 的 是 实话 ”或 者 说 “ 卡 罗 说 谎 了 ”; 最 后 亚 达 或 者 说 了 “ 饱 勃 说 卡 罗 在 
说 真 话 ” 或 者 说 “ 鲍 勃 说 卡 罗 说 谎 ” 。 这 种 解释 也 使 我 在 改写 这 个 问题 时 “摆脱 
了 双重 否定 ”。 

然而 ， 当 我 们 回归 到 原 话 “ 亚 达 和 否认 饱 勃 确认 卡 罗 在 说 谎 ” 时 ， 也 有 可 能 
情况 是 这 样 的 。 亚 达 被 问 到 “ 鲍 勃 确认 卡 罗 在 说 谎 吗 ?”， 亚 达 回 答 说 “不 ”。 如 
果 亚 达 说 谎 了 ， 那 么 这 意味 着 鲍 勃 的 确 说 了 “ 卡 罗 在 说 谎 ”。 而 如 果 亚 达 说 的 是 
真 话 ， 那 么 有 可 能 鲍 勃 否认 卡 罗 在 说 谎 ， 也 有 可 能 鲍 勃 在 这 个 问题 上 保持 了 沉 
默 。 爱 丁 顿 名 士 采用 的 就 是 后 一 种 解释 。 他 只 假设 卡 罗 说 了 一 句 真 话 或 是 假 话 ， 
然后 据 此 排除 了 明显 与 问题 不 符 的 话 (他 在 此 问题 上 也 用 到 了 他 创造 的 在 解释 物 
理学 观察 结果 时 运用 的 “排除 法 ”)。 在 他 的 观点 里 ,与 事件 4 不 符 的 情况 只 
L-TT 和 L-L-L。 而 我 们 排除 的 T-T-L 和 TEL-T 的 情形 在 他 的 假设 中 也 存在 。 他 
认为 所 有 亚 达 说 真 话 的 情形 都 是 与 事件 4 符合 的 ; 即 如 果 亚 达 说 的 是 真 话 ， 那 么 
我 们 就 无 法 简单 地 断定 鲍 勃 说 的 是 真是 假 ， 也 没有 任何 证 据 表明 卡 罗 没 有 说 真 
话 。 据 此 他 得 出 ，P(C 与 4) =7/27，P(4) =17/27， 最 后 得 出 卡 罗 说 真 话 的 概 
率 是 7/17。 

1936 年 12 月 期 的 《数学 公报 》 中 发 表 了 两 篇 文章 : 一 篇 上 赞同 爱 丁 顿 醚 士 的 
观点 ， 另 一 篇 则 反驳 他 的 观点 。 当 然 不 存在 绝对 的 标准 来 判断 对 错 ， 只 有 在 具体 
假设 基础 上 的 对 与 错 。 在 爱 丁 顿 姻 士 的 解释 下 卡 罗 无 法 被 证 明说 假 话 。 这 样 的 解 
释 也 必需 分 具体 的 场合 。 如 果 这 些 人 是 在 法 庭 上 作证 ， 我 们 的 解释 一 一 他 们 各 自 
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都 发 言 了 的 假设 是 符合 逻辑 的 。 而 如 果 是 用 于 解释 一 些 物理 学 原理 ， 那 么 爱 丁 顿 
事 士 的 解释 就 更 有 意义 。 我 相信 大 部 分 的 概率 学 家 会 认为 我 们 最 初 解决 这 个 问题 
的 办 法 是 唯一 合理 的 方法 。 尽 管 如 此 ， 我 不 会 做 出 像 瓦 伦 . 韦 弗 在 其 现代 经 典 著 
作 《 幸 运 女神 : 概率 学 理论 》(Lady Luck: The Theory of Probability) 一 书 中 对 爱 
丁 顿 事 士 那样 极端 的 评价 ， 认 为 爱 丁 顿 甸 士 得 出 的 结论 就 跟 做 出 的 假设 一 样 荒 廖 
(《 幸 运 女 神 : 概率 学 理论 》 于 1963 年 问世 ， 直 到 今天 它 仍 不 失 为 一 本 非 专 业 地 
介绍 概率 的 好 书 ) 。 当 然 ， 在 判断 谁 在 说 谎 的 一 系列 假设 ， 不 应 该 以 问题 公式 化 
的 形式 展示 出 来 。 这 样 反 而 会 使 问题 更 加 复杂 ， 让 争 强 好 胜 的 英国 天 文物 理学 家 
们 唆 唆 不 休 地 争论 。 下 面 我 把 爱 丁 顿 荔 士 的 原 题 列 出 : 

如 果 A、B、C、D 四 人 每 人 都 有 三 分 之 一 的 概率 说 真 话 (每 个 人 说 真 话 的 概 
率 都 是 独立 的 ) ，A 肯定 地 说 B 否认 了 C 宣称 D 是 骗子 的 话 ， 那 么 D 说 真 话 的 概 
率 是 多 少 ? 

我 把 这 一 题 留 给 读者 们 当做 练习 题 。 爱 丁 顿 事 士 给 出 的 答案 是 25/71， 而 按 
照 我 的 解释 ， 这 题 的 正确 答案 是 13/41。 




















1.7 全 概率 法 则 : 二 手 车 与 网 球赛 


想象 一 下 你 在 一 座 拥 堵 的 城市 买 了 一 辆 二 手 车 。 你 知道 大 约 5% 的 二 手 车 都 
被 水 泡 过 ， 而 在 被 水 泡 过 的 车 中 大 约 80% 以 后 都 会 出 现 严 重 的 发 动机 问题 ; 而 
没有 被 水 泡 过 的 车 大 约 只 有 10% 才 会 有 严重 的 发 动机 问题 。 当 然 , 没有 任何 二 
手 车 经 销 商会 坦白 地 告诉 你 这 辆 二 手 车 是 不 是 被 水 泡 过 。 所 以 你 就 必须 求助 于 概 
率 了 。 你 买 的 二 手 车 会 坏 的 概率 是 多 少 呢 ? 

你 也 许 认 为 这 个 问题 是 一 个 比例 问题 。 每 卖 出 1000 辆 车 ， 有 50 辆 之 前 被 水 
泡 过 ， 其 中 80% 即 40 辆 之 后 会 有 问题 。 剩 下 的 950 辆 没 被 泡 的 车 ， 我 们 预计 
10% 即 95 辆 也 会 发 生 同 样 的 问题 。 因 此 ， 我 们 算出 在 1000 辆 车 中 有 40 + 95 = 
135 辆 车 在 今后 会 有 问题 ， 得 到 的 概率 是 13. 5% 。 

如 果 你 用 这 样 的 方法 来 解决 问题 ， 那 么 恭喜 你 了 ， 你 无 形 中 用 到 了 全 概率 法 
则 。 这 也 是 概率 问题 经 常 使 用 的 法 则 。 如 果 用 概率 对 上 面 的 解法 进行 重新 演绎 ， 
那么 得 到 的 算法 是 : 

P (发 动机 问题 ) =0. 05 x0. 80 +0.95 x0. 10 =0. 135 
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我 们 首先 以 是 否 被 水 泡 过 为 标准 将 车 分 两 种 情况 ， 然 后 再 将 两 种 情况 下 分 别 计 
算出 来 的 概率 相 加 。 对 于 热爱 数学 公式 的 读者 ， 下 面 就 是 对 事件 4、B 的 通用 公式 : 
P(B) =P(BIA) xP(4) +P(BIl 非 4) xP( 非 4) 

周 日 晚上 你 和 你 的 两 个 同事 艾 伯 特 和 贝 琪 在 当地 的 酒吧 见面 小 酌 一 番 。 你 们 
讨论 起 了 每 天 上 班 你 要 坐 的 那 趟 公交 ， 大 约 有 40% 的 概率 会 晚点 。 你 决定 让 大 
家 预测 下 一 周 这 趟 车 的 晚点 情况 ， 看 谁 的 预测 最 准 。 你 们 将 会 列 出 五 个 L 和 T 
(分 别 代 表 “ 晚 点 ”和 “准点 ”)。 现 在 知道 公交 每 天 晚点 的 概率 是 40% ， 你 决 
定 按照 这 个 比例 随机 选 出 现 站 和 T 的 情况 。 艾 伯 特 也 有 同样 的 想法 ， 但 又 不 想 预 
测 太 多 次 晚点 ， 于 是 决定 预测 两 天 晚点 ， 三 天 准点 ， 然 后 随机 排列 。 贝 琪 觉得 公 
交 准 点 到 的 可 能 性 更 大 ， 于 是 简单 地 列 出 了 连续 五 天 都 是 T 的 情况 ( 艾 伯 特 听 完 
贝 琪 的 预测 ， 举 起 他 的 酒杯 ， 摇 头 叹息 到 “女人 啊 ! 怎么 可 能 每 天 都 准时 
呢 ?”) 。 那 么 谁 的 预测 最 可 能 是 完全 正确 的 呢 ? 

让 我 们 先 计 算 预 测 对 一 天 的 概率 是 多 少 吧 。 如 果 你 预测 的 是 T， 而 公交 又 是 
准点 的 话 你 就 对 了 ， 这 一 概率 是 0.6。 因 此 ， 贝 琪 每 天 都 选择 这 个 概率 ， 而 艾 伯 
特 只 选择 了 三 天 ， 另 外 两 天 准确 预测 晚点 的 概率 为 0.4。 而 你 运用 了 更 为 复杂 的 
策略 ， 每 次 都 预测 准确 。 依 据 全 概率 法 则 ， 你 一 天 预测 准确 的 概率 是 0.6 x0.6+ 
0.4x0.4=0.52。 一 共有 五 个 工作 日 ,那么 你 全 部 预测 准确 的 概率 为 0.525 = 
0. 038。 艾 伯 特 五 天 都 预测 准确 的 概率 为 0. 6 x0.4 =0.035 (不 论 他 预测 哪 一 天 
公交 准点 ， 概 率 不 变 ) ， 贝 琪 五 天 都 预测 准确 的 概率 为 0. 6 =0.078。 从 3.5% 、 
3.8% 和 7.8% 这 三 个 概率 看 出 ， 每 个 人 全 部 预测 准确 的 概率 都 很 低 ， 但 显然 
贝 琪 相对 来 说 更 有 优势 。 为 了 挽回 他 的 面子 ， 艾 伯 特 会 说 他 比 贝 琪 更 能 预测 准 
确 上 晚点。 一周 中 有 两 天 公交 会 晚点 的 概率 大 约 是 0.35 (用 0.035 x10 得 出 来 
的 结果 ， 你 知道 为 什么 这 样 计算 吗 ?) 。 当 然 ， 他 的 问题 在 于 如 何 确定 这 两 天 分 
别 是 周 几 。 

全 概率 法 则 在 出 现 两 个 以 上 事件 的 情况 下 也 是 同样 适用 的 。 假 设 安 娜 和 鲍 勃 
在 打 网 球 ， 处 于 局 末 平 分 的 状态 ， 谁 领先 两 分 就 可 以 赢得 比赛 了 。 已 知 每 一 球 安 
娜 赢 的 概率 是 2/3， 那 么 她 最 终 赢得 比赛 的 概率 是 多 少 ? 

答案 很 难 脱 口 而 出 。 事 实 上 安娜 要 赢得 这 场 比赛 存在 多 种 情况 。 她 可 以 连 得 
两 分 ， 可 以 先 赢 一 分 后 输 一 分 最 后 连 赢 两 分 。 她 还 可 以 先 赢 后 输 ， 再 赢 …… 再 输 
最 后 连 硫 两 分 。 总 之 有 无 数 种 可 能 ， 把 每 一 种 的 概率 计算 出 来 最 后 相 加 可 以 得 到 
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安娜 赢得 比赛 的 概率 。 你 尽管 试 坛 ， 反 正 我 不 用 这 种 方法 。 我 要 用 的 是 一 种 更 加 
简洁 的 方式 。 主 我 们 来 考虑 以 下 三 种 不 同 的 情况 : 
第 工种 情况 : 安娜 连 赢 两 球 
第 工种 情况 : 鲍 勃 连 启 两 球 
第 亚 种 情况 : 他 们 各 启 一 球 ， 不 论 先 后 顺序 
现在 运用 全 概率 公式 分 别 计算 这 三 种 情况 的 概率 ， 然 后 代入 下 列 公式 : 
P( 安 娜 说 ) = 已 (安娜 以 第 工种 情况 顾 ) xP(I) +P( 安 娜 以 第 工种 情况 
顾 ) xP(I) +P( 安 娜 以 第 亚 种 情况 赢 ) xP( 亚 ) 
这 三 种 情况 的 概率 分 别 是 多 少 呢 ? 我 们 假设 每 一 球 是 独立 的 ， 那 么 概率 分 别 是 
P (1)=2/3x2/3=4/9 
P (HH)=1/3x1/3=1/9 
P ( 亚 ) =4/9 
最 后 一 种 情况 的 概率 是 用 !1 减 去 前 两 种 情况 的 概率 和 得 到 的 。 目 前 为 止 没 有 
任何 问题 。 现 在 要 用 到 条 件 概率 了 。 前 两 种 情况 都 很 明确 : 第 工种 情况 下 安娜 启 
的 概率 为 1， 第 开 种 情况 下 为 0。 第 亚 种 情况 呢 ? 在 第 亚 种 情况 下 ， 两 个 人 又 重 
新 回 到 了 局 末 平 分 的 情况 ， 这 种 情况 下 的 概率 正 是 我 们 现在 要 计算 的 。 我 们 走 进 
死 明 同 了 吗 ? 
不 ! 恰恰 相反 ， 我 们 马上 就 要 得 出 正确 答案 了 。 因 为 P (安娜 启 ) 和 P (安娜 
以 第 亚 种 情况 赢 ) 是 相等 的 且 未 知 ， 我 们 假设 这 个 未 知 数 为 p， 然 后 将 已 知 的 概率 
代入 公式 ， 可 得 到 : p =1 x4/9 +0 x1/9 +p x4/9 =4/9 +p x4/9。 很 快 可 以 算出 
p=4/5。 在 解决 这 个 问题 时 我 们 并 没有 直接 去 计算 概率 ， 而 是 通过 分 析 三 种 可 能 
情况 ， 计 算出 两 种 的 概率 ， 第 三 种 又 将 问题 带 回 原来 的 情况 ， 再 通过 等 式 计算 未 
知 数 。 这 种 解法 是 不 是 非常 的 巧妙 。 通 过 这 个 例子 可 以 得 出 一 个 通用 的 公式 : 
wi + (1 -w)? 
图 1-6 以 树 状 图 的 方式 列 出 了 各 种 不 同情 况 。 
现在 让 我 们 来 解决 一 个 新 的 运动 赛事 问题 ， 这 一 次 讲 的 是 羽毛 球 。 在 美国 ， 
人 们 通常 会 在 自家 的 院子 里 打 羽 毛 球 ， 如 果 是 在 大 学 运动 馆 的 羽毛 球场 地 打 的 ， 
有 90% 的 都 是 亚 裔 ， 剩 下 的 就 是 北欧 人 、 英 国人 、 德 国人 和 新 西 兰 人 。 在 2005 
年 8 月 ， 白 国府 和 吴 俊明 在 世锦 赛 上 赢得 了 男子 双打 的 金牌 ， 这 是 美国 运动 员 首 














P( 安 娜 启 ) = 
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图 1-6 安娜 和 鲍 勃 在 局 末 平分 的 情况 下 各 种 情况 


次 在 羽毛 球赛 事 上 赢得 世界 冠军 ， 从 此 也 改写 了 历史 。 很 多 人 都 不 知道 羽毛 球 是 
最 快 的 球拍 类 运动 ， 它 的 时 速 可 以 达到 每 小 时 200 英里 ， 对 于 羽毛 球 这 个 小 球 来 
说 非常 快 了 。 

在 羽毛 球赛 中 只 有 你 发 球 时 才 可 以 得 分 ?9 ， 球 来 回 打 一 次 被 称 为 “对 打 ”。 
因此 当 你 发 球 ， 连 续 对 打 启 得 一 球 时 你 才 会 得 分 。 如 果 你 接 球 时 赢 了 ， 那 么 分 数 
不 会 改变 ， 只 是 取得 了 发 球 权 ， 获 得 了 赢 球 得 分 机 会 。 假 设 安 娜 和 鲍 勃 都 是 非常 
棒 的 网 球 运动 员 ， 在 每 一 次 对 打 时 安娜 赢 的 概率 是 1/2 (这 在 羽毛 球 比 赛 中 是 很 
正常 的 ， 但 是 在 网 球 比赛 中 谁 发 球 谁 就 有 很 大 的 优势 ) 。 那 么 当 安娜 发 球 时 ， 她 
得 分 的 概率 是 多 少 ? 

我 们 仍 采 用 在 网 球 问 题 中 同样 的 思路 ， 分 三 种 情况 讨论 : 

第 工种 情况 : 安娜 赢 了 一 次 对 打 
第 工种 情况 : 安娜 连 输 两 次 对 打 
第 亚 种 情况 : 安娜 先 输 一 次 对 打 再 赢 一 次 

第 工种 情况 下 ， 安 娜 得 分 ; 第 下 种 情况 下 ， 鲍 勃 得 分 ; 第 焉 种 情况 他 们 又 回 
到 了 安娜 重新 发 球 的 局 面 ， 没 有 人 得 分 。 计 算 可 知 P( I 了 ) =1/2，P(I) =1/4， 
P( 王 ) =1/4,P (安娜 以 第 I 种 情况 廉 ) =1，P (安娜 以 第 工种 情况 启 ) =0。P 
(安娜 以 第 亚 种 情况 赢 ) 等 于 我 们 需要 计算 的 己 (安娜 赢 ) 。 用 未 知 数 p 代入 公式 

















G@ 这 是 2006 年 以 前 的 羽毛 球 比赛 规则 。 
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可 得 : p=1x1/2 +0 x1/4+px1/4=1/2 +px1/4, 算出 p=2/3。 因 此 ， 发 球 者 
是 有 很 大 的 优势 的 ， 如 果 是 在 双方 球员 实力 不 均 的 情况 下 ， 优 势 更 明显 。 例 如 ， 
安娜 每 一 次 对 打 有 0. 55 的 可 能 性 会 赢 ， 那 么 她 有 发 球 权 时 得 分 的 概率 就 会 上 升 
到 0.73。 这 就 可 以 解释 为 什么 15:3 或 15:4 这 样 的 悬殊 比分 会 在 羽毛 球赛 事 中 出 
现 。 通 过 这 个 例子 可 以 得 出 一 个 通用 的 公式 : 




















2 言 \_ 20 
P (安娜 赢 ) = TI py 

w 指 安娜 在 每 一 次 对 打 赢 的 概率 。 这 里 给 大 家 留 一 道 练习 题 ， 大 家 可 以 自己 
去 推导 一 下 这 个 公式 。 








1.8 组 合 : 饮食 搭配 与 百 万 亿 首 诗 


组 合 是 关于 计数 的 一 种 数学 方法 ， 它 在 许多 概率 问题 中 常常 会 出 现 。 组 合 的 
一 个 基本 原则 就 是 乘法 原理 ， 这 比 用 语言 描述 要 简单 易 懂得 多 。 我 们 以 晚餐 为 例 
吧 。 有 一 家 熟食 店 ， 店 里 有 三 种 面包 、 三 种 奶 酷 、 四 种 肉 、 两 种 芥末 。 那 么 ， 你 
用 这 些 材料 可 以 做 出 多 少 种 不 同 的 肉 和 奶 酷 组 合成 的 三 明治 呢 ? 首先 选取 一 种 面 
包 ; 每 一 种 面包 都 可 以 搭配 三 种 不 同 的 奶酪 ， 这 样 就 有 3 x3 =9 种 面包 奶 酷 组 合 
( 黑 麦 面包 /瑞士 干酪 ， 黑 麦 / 波 葛 伏 洛 干酪， 黑 麦 / 切 达 干酪 ， 小 麦 面包 /瑞士 干 
酷 ， 小 麦 面包 / 波 葛 伏 洛 干酪 …… 发 挥 你 的 想象 吧 ) 。 接 着 随机 在 四 种 肉 中 选 一 种 
肉 ， 最 后 再 选 一 种 芥末 或 者 不 要 芥末 。 你 一 共 可 以 做 出 3 x3 x4 x3 =108 种 不 同 
的 三 明治 。 假 设 现 在 你 还 可 以 选择 是 否 要 加 生菜 、 西 红 柿 或 者 洋葱 。 这 又 增加 了 
另外 的 2 x2 x2 =8 种 组 合 (每 一 种 食材 都 可 以 选择 加 或 者 不 加 ) ， 结 合 之 前 的 
108 种 选择 ， 现 在 一 共有 108 x8 =864 种 组 合 。 

这 就 是 乘法 原理 。 每 一 步 你 都 有 多 种 选择 ， 把 所 有 各 步 的 选择 相 乘 就 得 到 总 
的 组 合 种 数 。 你 会 惊奇 地 发 现 组 合 数 增加 得 非常 迅速 。 每 多 一 种 面包 、 奶 酷 或 是 
肉 ， 最 后 的 奶 酷 也 会 变 成 1920 种 选择 。 大 概要 一 年 的 时 间 你 才能 吃 完 这 些 不 同 
组 合 的 三 明治 。 

另 一 个 例子 就 是 在 下 国际 象棋 的 时 候 走 了 两 步 之 后 会 出 现 多 少 种 可 能 的 位 
置 。 白 棋 先 走 ， 有 20 种 开局 的 方式 。 白 棋 每 一 种 开局 方式 黑 棋 接 下 来 的 一 步 都 
有 20 种 可 能 ， 因 此 走 了 两 步 之 后 有 20 x 20 = 400 种 可 能 的 位 置 (但 是 在 正式 的 
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比赛 中 一 般 都 具有 几 种 开局 的 方式 ) 。 走 完 开 局 的 两 步 之 后 ， 之 后 能 走 的 位 置 就 
要 依据 之 前 的 位 置 来 确定 了 。 尽 管 如 此 ， 每 一 步 棋 能 走 的 位 置 数 还 是 会 迅速 增加 ， 
难怪 计算 机 通常 比 常人 要 走 得 好 。 还 有 另外 一 个 耳熟能详 的 故事 ， 国 王 同 意 给 发 明 
象棋 的 人 奖赏 ， 奖 品 就 是 大 米 。 发 明 者 要 求 在 棋盘 上 的 第 一 格 放 一 粒 米 ， 第 二 格 上 
放 两 粒 米 ， 成 倍增 加 ， 直 到 这 棋盘 上 的 64 格 都 加 满 。 最 后 一 个 格 居然 需要 2 x 
2 x… x2 =223 粒 米 ， 这 些 米 都 够 做 出 能 够 让 全 世界 人 吃 无 数 年 的 寿司 了 。 

法 国 诗人 和 小 说 家 雷 蒙 ' 格 诺 在 1961 年 写 的 一 本 书 名 叫 《 百 万 亿 首 诗 》 (One 
Handred Thousand Billon Poems) ， 它 建立 了 概率 和 诗歌 的 联系 。 这 本 书 一 共有 十 页 ， 
每 一 页 都 有 一 首 十 四 行 诗 。 每 一 行 之 间 都 剪 了 一 九 ， 因 此 每 一 行 都 可 以 单独 地 翻 
页 。 因 为 所 有 的 诗句 都 有 相同 的 韵脚 和 相同 的 语法 结构 ， 不 同 页 面 的 横 条 随意 组 合 
便 是 一 首 十 四 行 诗 。 这 样 就 有 108 首 诗 了 ， 也 就 是 百 万 亿 首 诗 。 有 人 计算 过 读者 每 
天 24 小 时 一 刻 不 停 地 阅读 要 花 两 亿 年 才能 读 完 。 我 会 另外 推荐 他 的 一 本 书 《 风 格 
练习 》 (Exercises in Style) ， 该 书 也 是 以 同样 的 手法 讲 了 %9 个 故事 ， 这 本 书 你 用 一 
下 午 就 能 读 完了 。 有 人 可 能 就 会 问 他 觉得 自己 最 得 意 之 作 是 什么 ， 他 大 概 会 回答 : 
“我 也 不 知道 ， 因 为 我 还 有 很 多 连 看 都 没 看 过 。” 

概率 在 这 里 是 怎么 样 发 挥 作用 的 呢 ? 下 面 举 另 外 一 个 例子 。 瑞 典 的 车 牌号 中 
前 三 位 是 字母 ， 后 三 位 是 数字 。 随 机 选择 一 个 车 牌号 ， 使 其 既 没 有 重复 字母 又 没 
有 重复 的 数字 的 概率 是 多 少 ? 

首先 要 知道 在 瑞典 的 字母 表 中 有 多 少 个 字母 。 有 没有 一 些 像 4、 站 和 5 一样 
的 字母 。 当 然 是 有 的 ， 但 是 在 车 牌号 里 并 不 用 这 些 字 母 。 还 有 一 些 其 他 的 字母 也 
不 用 ， 可 以 用 的 一 共有 23 个 字母 。 因 此 ,一 共有 23 x23 x23 x10 x10 x10 种 组 
合 的 方式 ,将 近 一 千 两 百 万 个 车 牌号 (排除 典型 的 法 饰 性 汽车 牌照 ， 如 VIKING 
或 是 IABBA) 。 要 得 到 一 个 没有 重复 字母 的 车 牌号 首先 可 以 随意 选择 一 个 我 们 
想 要 的 字母 ， 这 里 共有 23 种 选择 。 接 下 来 的 那个 字母 不 能 跟 第 一 个 字母 一 样 ， 
所 以 就 有 22 种 选择 。 第 三 个 字母 又 不 能 跟前 两 个 字母 一 样 ， 剩 下 21 种 选择 。 对 
于 选择 数字 来 说 也 是 一 样 的 道理 ， 这 三 个 数字 的 选择 分 别 有 10、9、8 种 。 因 此 
字母 与 数字 都 不 重复 的 车 牌号 一 共有 23 x22 x21 x10 x9 x8 种 。 将 这 个 数 除 以 
总 数 得 到 


和 ra、 23 x22 x21 x10 x9 x8 ~ 
P (不 存在 重复 字母 和 数字 ) = 了 3 3 x23 x10x10x10~053 
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对 于 车 牌号 问题 来 说 ， 字 母 数 字 的 排列 顺序 非常 的 重要 。 比 如 车 牌 ABC123 
与 车 牌 BCA231 是 不 一 样 的 。 而 在 另 一 些 组 合 问题 中 ， 顺 序 却 是 不 需要 考虑 的 ， 
比如 跟 扑 克 有 关 的 问题 。 你 有 一 手 牌 ( 从 一 副 牌 中 抽出 来 的 五 张 ) 。 那 么 这 五 张 
牌 恰好 是 同 花 (五 张 牌 的 花色 一 样 ， 但 并 非 连 牌 ) 的 概率 是 多 少 呢 ? 

首先 算出 从 整 副 牌 中 随意 抽 五 张 牌 有 多 少 种 情形 ， 然 后 计算 恰好 是 同 花 的 
概率 是 多 少 。 第 一 张 牌 有 52 种 不 同 的 选择 ， 第 二 张 牌 有 51 种 选择 ， 一 直到 第 
五 张 有 48 种 选择 。 所 以 一 共有 52 x 51 x … x48 =311875200 种 不 同 的 情况 。 
但 是 我 们 需要 考虑 到 顺序 问题 。 比 如 说 你 按照 顺序 依次 抽 到 ( hA，0 A，A2， 
YA， 唱 A) 和 按 顺 序 依次 抽 到 ( 品 A，%2，0 A，@A，YVA) 其 实 是 同一 手 
牌 。 不 管 顺序 如 何 ,， 4 个 A 依然 是 4 个 A。 那 么 总 共有 5 x4 x3 x2 xl =120 种 不 
同 的 方式 去 排列 五 张 牌 ( 同 理 还 是 第 一 张 牌 5 种 选择 ， 第 二 张 4 种 ， 以 此 类 推 ) ， 
因此 需要 用 311875200 除 以 120 得 到 2598960 ， 也 就 是 说 你 可 以 拿 到 约 260 万 种 
可 能 的 手 牌 。 

现在 假设 拿 到 的 同 花 花 色 是 红 桃 。 第 一 张 抽 到 红 桃 的 情形 有 13 种 ， 第 二 张 
是 12 种， 以 此 类 推 。 一 共有 13 x12 x11 x10 x9/120 =1287 种 拿 到 红 桃 的 情形 。 
但 是 这 些 情形 里 存在 着 五 张 牌 是 连 牌 的 10 种 情形 ， 我 们 在 计算 时 需要 减 去 这 
10 种 情形 ， 剩 下 1277 种 情形 。 一 副 牌 里 有 四 种 花色 ， 共 有 4 x1277 =5108 种 
同 花 的 情形 。 因 此 概率 为 5108/2598960 =0. 002。 这 意味 着 每 500 次 中 有 一 次 
是 同 花 。 

我 们 需要 引进 一 些 概念 ， 方便 我 们 今后 适用 。 相 信 你 对 的 阶乘 一 定 不 陌 
生 ， 即 





























nl=nx(n-1)x:…x2x1 

因此 11=1, 21 =2, 31=6, 41 =24,，51=120,61 =720。 在 这 里 感叹 号 表 
示 的 可 不 是 惊讶 ， 而 是 表示 阶乘 。 例 如 ， 一 副 牌 随机 排列 的 情形 一 共有 52! 种 ， 
这 可 是 一 个 天 文 数字 。 从 这 副 牌 中 取出 一 张 之 后 再 重新 洗 牌 。 你 认为 洗 过 之 后 牌 
的 顺序 跟 此 前 出 现 的 某 一 次 牌 的 顺序 会 一 模 一 样 吗 ?几乎 不 可 能 。 假 设 地 球 上 
65 亿 人 每 人 每 十 秒 钟 洗 一 副 牌 ， 一 直 不 停 地 洗 牌 大 约 要 花 四 百 万 的 42 次 方 年 的 
时 间 才 能 将 所 有 的 情形 都 列 出 。 这 些 有 51 位 数 的 情况 确实 需要 漫长 的 时 间 才 能 
逐一 实现 。 

上 面 我 们 通过 计算 得 出 了 随意 从 一 副 牌 中 取出 五 张 牌 时 所 有 可 能 的 组 合 情 
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况 ， 即 52 x 51 x… x48/51。 从 nn 个 对 象 中 任意 选 出 个 对 象 ， 通 常 有 nx 
(nn 一 1) x…x(n-k+1)/Ak! 种 不 同 的 组 合 情 形 。( 读 者 们 可 以 试 着 验证 !) 用 公 
式 表 达 即 为 
ER 1) 2 x(n-k+1) 
也 称 为 二 项 式 系 数 。 如 果 这 个 分 子 式 让 你 看 起 来 特别 烦 ， 你 只 要 记 住 有 个 对 象 
就 可 以 了 。 因 此 一 共有 C5, 种 同 花 的 情况 ， 有 Cs, - 10 种 情况 不 是 同 花 的 情况 ， 
一 副 牌 中 四 种 花色 共有 4 x (Cia -10) 种 出 现 同 花 的 情况 。 跟 我 们 之 前 计算 出 来 的 
结果 对 比 一 下 看 是 否 相 等 。 同 时 通过 笔算 确认 一 下 下 述 公式 的 正确 性 : 
Ce =Co 

比如 你 需要 笔算 C% ， 就 可 以 通过 计算 Cl 来 得 到 结果 (实际 算 一 次 你 就 知道 
为 什么 这 样 做 了 ) 。 这 种 算法 的 一 个 基本 依据 就 是 选择 个 对 象 其 实 就 是 把 剩 下 
的 n-- 上 个 对 象 选择 出 来 了 。 所 以 它们 必然 是 相等 的 。 现 在 大 家 很 少 再 用 笔算 了 ， 
连 最 简单 的 便携 计算 器 都 已 经 有 计算 C* 的 功能 了 。 但 是 知道 这 个 公式 对 我 们 依 
然 非常 有 用 。 

下 面 就 举 一 个 日 常 家 庭 保健 的 例子 。 据 观察 两 种 药物 相互 作用 发 生 危险 的 概 
率 是 6 双 ， 而 同时 吃 $ 种 药 的 话 这 种 风险 就 差不多 达到 了 $0 多 。 那 么 当 同 时 吃 9 
种 药 ， 风 险 会 变 得 多 高 呢 ? 首先 我 们 可 以 计算 出 当 吃 9 种 药 时 一 共有 Cs = 9 x 
8/2 =36 种 药物 两 两 成 对 的 可 能 。 接 下 来 我 们 就 要 算出 至 少 有 一 对 是 会 发 生 相 互 
作用 的 概率 ， 这 时 又 需要 用 到 概率 第 一 法 则 了 。 任 何 两 种 药物 之 间 不 发 生 互相 作 
用 的 概率 是 0. 94 ， 假 设 每 一 对 药物 不 发 生 作用 的 事件 是 相互 独立 的 ， 那 么 所 有 药 
物 都 不 互相 作用 的 概率 就 是 

已 (不 发 生 互相 作用 ) =0.94"=0. 11。 

所 以 这 9 种 药物 会 发 生 相 互 作 用 的 概率 是 1 -0.11 =0.89， 差 不 多 高 达 
90% 。 有 人 就 会 质疑 ， 每 一 对 药物 不 发 生 作 用 的 事件 真 的 相互 独立 吗 ? 如 果 药 物 
A 与 药物 B 发 生 了 反应 ， 那 么 也 许 它 跟 其 他 药物 也 会 发 生 反应 的 概率 就 更 高 了 。 
为 了 验证 这 个 假设 ,我 们 可 以 用 其 他 的 已 知 信息 来 证 明 ， 即 同时 吃 5 种 药 会 产生 
药物 相互 作用 的 概率 大 约 是 50% 。 对 于 这 5 种 药物 来 说 有 C =5 x4/2 =10 对 药 ， 
在 事件 独立 的 前 提 下 这 10 对 药 发 生 反应 的 概率 是 1 -0.94" 二 0.46。46% 跟 试验 
统计 得 出 的 50% 非常 接近 ， 这 就 可 以 支持 我 们 的 假设 了 。 这 个 例子 是 本 书 的 一 
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个 匿名 评论 家 告诉 我 的 ， 借 此 机 会 再 次 感谢 ! 

一 个 更 有 趣 的 问题 来 了 。 现 在 撕 六 次 骨 子 ， 六 个 数字 每 个 都 出 现 的 概率 是 多 
少 ? 乍 一 看 这 个 问题 与 组 合 没有 什么 关系 ， 但 是 我 们 可 以 把 这 种 情形 想象 成 6 个 
球 和 6 个 盒子 ， 分 别 把 它们 标号 ， 从 1 标 到 6。 现 在 开始 掷 仍 子 。 如 果 掷 出 了 1 
就 把 1 号 球 放 到 1 号 盒子 里 ;如 果 掷 出 了 2 就 把 1 号 球 放 到 2 号 盒子 里 ， 以 此 类 
推 。 再 掷 一 次 仍 子 ， 又 把 2 号 小 球 按照 掷 出 来 的 数字 放 到 相应 的 盒子 中 去 。 掷 完 
六 次 骨 子 ，6 个 小 球 也 按照 掷 出 来 的 数字 分 别 放 在 各 个 盒子 中 ， 一 共有 6 种 放 小 
球 的 方式 。 而 掷 出 六 个 不 同 的 数字 的 情形 有 6! 种 。 所 以 分 别 掷 出 六 个 数字 的 概 
率 是 





已 (分别 掷 出 六 个 数字 ) =61/6" =0.015。 
对 于 这 个 问题 的 一 个 基本 总 结 是 个 球 放 在 n 个 盒子 中 ,没有 一 个 空 盒子 的 
概率 是 P (没有 空 盒子 ) =n1l/n"。 
随 着 n 的 变化 ， 分 子 分 母 都 在 迅速 地 变 大 ,但 是 对 于 这 个 分 子 式 来 说 却 是 n 
越 大 概率 越 接近 0。 





1.9 特 普 拉 一 家 与 二 项 分 布 


回 到 我 们 之 前 举 过 的 例子 : 计算 一 个 有 三 个 孩子 的 家 庭 只 有 一 个 孩子 是 女孩 
的 概率 。 我 们 先 把 8 种 可 能 的 情况 列 出 来 ， 然 后 再 数 出 只 有 一 个 女儿 的 情形 ， 最 
后 得 出 结果 为 3/8 。 这 个 问题 还 有 第 二 种 解决 方法 。 首 先 要 注意 到 两 个 男孩 一 个 
女孩 不 同 的 排列 顺序 代表 的 事件 是 不 同 的 。 如 BBG 的 概率 为 1/2 x1/2 x1/2=1/ 
8。 而 两 个 男孩 一 个 女孩 一 共有 三 种 情况 (GBB，BGB，BBG)， 所 以 概率 为 3 x 
1/8 =3/8, 

现在 让 我 们 来 考虑 一 个 有 七 个 孩子 的 家 庭 ， 特 普 拉 一 家 ， 这 个 家 庭 有 五 个 女 
孩 的 概率 是 多 少 呢 ? 一 共有 2” = 128 种 情形 ， 从 BBBBBBB 到 GGGGGGG。 如 果 
要 把 这 128 种 情形 全 都 列 出 来 再 找 出 其 中 有 五 个 女孩 的 情形 ， 这 种 作法 也 太 死 板 
了 。 我 们 就 用 第 二 种 方法 来 试 试 吧 。 每 一 种 出 现 5 个 女孩 2 个 男孩 的 事件 ， 如 
GBGGBGSG 的 概率 为 (1/2) 7”。 剩 下 的 问题 就 是 有 多 少 种 这 样 的 情形 。 此 时 就 需 
要 用 到 组 合 的 知识 了 ， 问 题 就 变 成 了 让 这 五 个 女孩 站 在 七 个 孩子 的 位 置 上 有 多 少 
种 站 法 ? 答案 是 C7。 上 一 节 我 们 已 经 知道 计算 C; 的 值 更 简单 ， 即 7 x6/2 =21。 
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所 以 特 普 拉 一 家 有 五 个 女儿 的 概率 是 
P (五 个 女儿 ) =21 x (1/2)" =0. 16。 

特 普 拉 家 的 问题 解决 了 ， 读 者 们 再 来 解决 一 下 杰克 示 家 的 问题 吧 。 有 九 个 孩 
子 的 杰克 逊 一 家 有 三 个 女孩 的 概率 是 多 少 呢 ? 9 

接 下 来 再 介绍 一 个 可 以 用 同样 的 方法 解决 的 问题 。 你 搓 12 次 崩 子 , 希望 能 
掷 出 两 个 6， 这 一 事件 的 概率 是 多 少 ?” 现在 脑子 里 想 一 想 在 12 个 数字 中 有 两 个 
6， 比 如 xx6x6xxxxxxx， 其 中 x 表示 除 6 之 外 的 其 他 数字 。 根 据 独立 性 我 们 可 以 用 
乘法 将 分 别 的 概率 相 乘 5/6 x 5/6 x 1/6 x … x5/6， 可 以 将 其 改写 为 (1/6)? x 
(5/6)"。 这 一 概率 只 是 随意 两 个 位 置 上 数字 是 6 的 概率 ， 我 们 还 需要 考虑 有 多 
少 种 出 现 两 个 6 的 情况 。 就 像 上 面 的 问题 一 样 ， 我们 还 需要 给 这 两 个 6 选 一 选 位 
置 。 所 以 这 一 事件 的 概率 为 

P(12 次 掷 仍 子 两 次 掷 出 6) = Ci, x (1/6)? x (5/6)" =0.3 

如 果 我 们 用 简单 地 在 样本 空间 中 数 的 方法 ， 我 们 必须 注意 到 x 表 示 的 是 不 等 
于 6 的 数字 ， 所 以 我 们 不 能 简单 地 使 用 2”=4096 的 样本 空间 ， 即 从 xxxxxxxxxxxx 
到 666666666666。 我 们 必须 把 每 一 个 X 都 用 除 6 以 外 的 5 种 不 同 的 情况 代入 ， 得 
出 6" 的 样本 空间 ， 比 20 亿 大 一 些 。 用 这 种 方法 来 解决 问题 未 学 不 可 ， 但 我 并 不 
推荐 。 

现在 我 们 来 总 结 一 下 公式 吧 。 假 设 有 一 个 具体 的 试验 (比如 生 和 孩子 或 者 掷 骨 
子 ) 要 重复 nn 次， 我们 把 每 一 次 尝试 都 看 成 一 次 试验 。 试 验 成 功 的 概率 为 p»， 每 
一 次 试验 相互 独立 。k 次 成 功 的 概率 为 

已 (下 次 成 功 ) = Ct xp* x (1-p)"* 

其 中 天 可 以 为 0 到 n 中 的 任意 数 。 当 等 于 0 或 等 于 n 时，C% 的 值 为 1， 当 天 无 
限 接近 0 值 也 会 视 为 1。 在 n 次 尝试 中 成 功 0 次 的 概率 为 (1 -p)"， 而 n 次 都 成 
功 的 概率 为 p"。 我 们 将 不 同 次 数 的 成 功 概率 称 为 二 项 式 分 布 (C 被 称 为 二 项 式 
系数 ， 你 可 能 还 知道 是 牛顿 提出 的 二 项 式 定 理 )。n 和 pp 被 称 为 二 项 式 分 布 的 系 
数 。 在 上 文 举 的 特 普 拉 一 家 的 例子 中 , =7, p = 1/2; 在 掷 蜗 子 的 例子 中 ,7 























名 “可 别 把 杰克 逊 家 的 女儿 们 叫做 珍妮 . 杰克 进 或 是 拉 托 亚 . 杰克 逊 。( 只 是 为 读者 们 看 书 增加 一 点 
点 小 趣味 ) 。 
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12, p=1/6。 而 在 药物 反应 的 例子 中 n=36, p =0.06， 我 们 可 以 推算 出 =0 的 
概率 。 

在 二 项 式 分 布 中 有 两 个 假设 前 提 至 关 重 要 。 第 一 个 前 提 就 是 这 些 连续 的 试验 
必须 是 相互 独立 的 ; 第 二 个 前 提 是 要 保证 每 一 次 试验 成 功 的 概率 都 为 p。 让 我 们 
用 一 个 具体 的 例子 来 说 明 这 两 个 条 件 。 如 果 某 一 天 的 温度 达到 了 90 华氏 度 ， 那 
么 这 一 天 就 是 “ 热 ” 的 。 假 设 新 奥尔良 州 7 月 上 旬 的 一 天 是 “ 热 ”的 概率 为 
0.7。 现 在 你 决定 来 算 一 算 下 面 各 具体 期 间 里 有 多 少 天 是 热 的 : 

(1) 接 下 来 五 年 的 每 年 7 月 4 日 
(2) 明年 7 月 的 第 一 周 
(3) 明年 每 个 月 的 第 一 天 

这 三 种 情况 都 符合 二 项 式 分 布 吗 ? 只 有 第 一 种 情况 符合 。 每 年 7 月 4 日 的 气 
温 当 然 是 独立 于 其 他 年 份 的 ,7 月 上 旬 每 天 热 的 概率 也 能 保持 在 0.7 的 水 平 ( 当 
然 要 保证 全 球 变 暖 的 速度 没有 那么 快 ) 。 因 此 这 个 二 项 式 分 布 参数 的 值 分 别 是 ”= 
5, p=0.7。 在 第 二 种 情况 中 ， 每 一 天 的 天 气 并 不 是 相互 独立 的 。 因 为 如 果 7 月 1 
日 天 气 热 ， 那 么 第 二 天 气温 高 的 概率 会 更 高 ， 因 为 这 两 天 都 处 于 同一 个 天 气 系统 
的 控制 之 下 。 因 此 在 这 种 情况 之 下 不 存在 二 项 式 分 布 。7 月 上 旬 的 一 天 是 “ 热 ” 
的 概率 为 0.7 这 个 条 件 换 一 种 说 法 ， 指 的 是 通过 历年 的 记录 表明 大 约 有 70% 的 概 
率 七 月 的 上 旬 是 热 的 。 这 些 热 的 天 气 会 集中 在 某 些 年 份 ， 而 在 另外 某 些 年 份 几乎 
没有 热天 。 平 均 来 说 10 天 中 有 7 天 是 热 的 ， 连 续 的 日 子 是 否 会 热 这 一 事件 并 不 
是 独立 的 。 

在 最 后 一 种 情况 中 ， 尽 管 每 个 月 的 第 一 天 的 天 气 状况 是 相互 独立 的 〈 一 个 天 
气 系 统 的 控制 期 没有 那么 长 ) ， 但 是 问题 在 于 不 能 保证 每 天 的 概率 不 变 。1 月 1 
日 是 热 的 ， 这 个 事件 的 概率 远 远 要 低 于 0.7。 所 以 在 这 种 情况 之 下 也 不 存在 二 项 
式 分 布 。 

回想 一 下 1.7 节 中 酒吧 小 酌 的 合子， 假设 你 用 策略 猜 到 了 公交 晚点 的 天 数 。 
这 些 天 符合 二 项 式 分 布 ， 其 中 路 =5 (一 周 中 有 五 个 工作 日 ), P=0.4 (任何 一 天 
公交 晚点 的 概率 ) 。 这 一 次 ， 贝 琪 的 预测 最 不 准确 。 她 的 预测 完全 正确 的 概率 等 
于 公交 从 不 晚点 的 概率 ， 也 就 是 上 =0， 利 用 公式 计算 出 概率 为 0. 6 =0. 08。 如 果 
公交 两 天 晚点 则 艾 伯 特 猜 对 了 ， 概 率 为 

P( 公 交 两 天 晚点 ) = C; x0.4” x0.6 =0.35 
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这 一 答案 也 回答 了 我 在 1.7 节 酒 吧 小 酌 例 中 提出 的 问题 。 你 预测 对 的 概率 计 
算 起 来 稍 显 复杂 。 因 为 你 的 预测 和 实际 的 结果 都 符合 二 项 式 分 布 ， 所 以 我 们 必须 
要 用 到 全 概率 法 则 。 如 果 你 猜测 0 次 ， 那 么 概率 为 0. 6 =0. 08 ， 即 如 果 公 交 从 不 
晚点 ， 你 猜 对 的 概率 为 0. 08 。 全 概率 中 的 第 一 项 是 0.08 x 0. 08 = 0. 08` 。 接 下 来 
需要 用 到 二 项 式 计算 当 大 = 1 时， 概率 为 5 x0.4 x0.6:=0.26， 即 当 你 预测 晚点 
一 次 且 事实 上 的 确 晚点 一 天 的 概率 。 然 后 把 这 一 概率 平方 加 上 之 前 的 概率 
0. 082 +0. 26*。 用 这 样 的 方法 计算 全 部 6 种 情况 的 概率 并 分 别 平方 ， 即 大 从 0 到 
5， 然 后 再 全 部 相 加 。 计 算出 来 的 概率 就 是 你 预测 准确 的 概率 ， 你 可 以 验证 一 下 
出 来 的 是 0.25。 艾 伯 特 终于 一 雪 前 了 了 。 
让 我 们 再 来 扔 扔 硬币 吧 。 当 你 扔 四 枚 硬币 时 ， 最 典型 的 情况 就 是 两 枚 正面 朝 
上 ， 两 枚 反面 彰 上 。 这 种 情况 的 概率 用 二 项 式 计算 为 
P( 两 枚 正面 朝 上 ) =Cs x (1/2)* =3/8 
同 理 ， 当 你 扔 六 枚 硬币 时 ， 最 典型 的 情况 就 是 三 枚 正面 朝 上 ; 当 你 扔 八 枚 硬 
币 时 ， 四 枚 正面 朝 上 的 情况 最 典型 。 那 么 当 你 扔 偶数 枚 硬币 时 ， 出 现 正 面 朝 上 和 
反面 朝 上 的 数量 相等 这 种 最 典型 情况 的 概率 是 多 少 ? 假设 你 扔 的 是 2n 枚 硬币 ， 
需要 计算 得 到 枚 正面 朝 上 的 概率 。 用 二 项 式 分 布 ， 得 出 公式 
P(n 枚 朝 上 ) =C%, x (1/2)” 
当 n 的 值 很 大 时 很 难 马 上 计算 出 来 。 在 这 里 给 大 家 介绍 一 个 实用 的 近似 公 
式 一 一 斯 特 林 (stirling) 公式 。 这 个 公式 的 推导 需要 很 大 的 技巧 ， 我 就 不 一 一 详 
述 了 。 如 果 读 者 感 兴趣 的 话 可 以 自己 去 查找 相关 的 资料 。 它 的 推导 过 程 非常 灵 
活 。 总 之 ， 最 后 我 们 可 以 得 到 的 近似 公式 是 
P(n 枚 朝 上 ,n 枚 朝 下 ) 守 1/ Vnxm 
你 可 能 会 想 这 个 并 究竟 为 什么 会 出 现在 这 里 。 这 不 就 是 著名 的 圆周 率 3. 14 
吗 ? 的 确 如 此 ， 但 是 每 一 个 学 数学 的 人 都 知道 5 这 个 数字 常常 会 在 许多 意 想 不 到 
的 情况 下 出 现 S。 你 要 做 好 准备 ， 随 时 都 有 可 能 再 次 看 到 它 。 让 我 们 用 四 榴 硬币 
来 验证 一 下 这 个 公式 吧 。 在 这 种 情况 下 =2，P(2 枚 朝 上 ，2 枚 朝 下 ) = 
























































加 ”还 存在 其 他 出 现 站 的 情况 。 如 随机 选择 一 个 整数 是 无 平方 数 因数 (不 能 被 4、9 等 这 些 平方 数 整 
除 ) 的 概率 为 6/ 到 ; 如果 随 机 选择 两 个 数 ， 它 们 互 质 (没有 公 因 数 ) 的 概率 也 是 6/™™?。 
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1Z V2 xT=0.40。 而 我 们 之 前 计算 出 来 的 值 为 3/48 ， 用 小 数 表示 为 0.375。 两 个 
数 很 接近 。n 的 值 越 大 两 个 公式 计算 出 来 的 值 就 越 接近 。 随 着 n 不 断 变 大 ， 
1Z Vn xT 也 不 断 接近 于 0。 因此 这 种 看 似 最 典型 的 情况 出 现 的 概率 其 实 会 越 来 越 
小 。 它 只 是 从 平均 的 角度 上 说 反复 地 扔 这 2n 枚 人 硬币， 平均 统计 下 来 , 枚 正面 
朝 上 的 情况 最 常见 ， 并 非 表 示 具 体 地 某 一 次 扔 这 2n 枚 硬币 结果 一 定 是 n 枚 正面 
朝 上 。 关 于 这 个 问题 ， 在 下 文中 将 会 深入 介绍 。 

最 后 让 我 们 再 举 一 个 运动 的 例子 吧 。 弱 旅 更 容易 赢得 美国 橄榄 球 超级 杯 大 赛 
(也 称 为 超级 杯 ) 或 世界 职业 棒球 赛 (也 称 为 世界 大 赛 ) 吗 ? 这 两 个 比赛 赛制 的 
不 同 之 处 在 于 超级 杯 是 一 场 比赛 决胜 负 ， 而 世界 职业 棒球 赛 是 由 七 场 比赛 组 成 
的 。 哪 一 种 赛制 对 于 弱 旅 来 说 更 有 利 呢 ? 让 我 们 排除 主场 优势 以 及 其 他 一 些 复杂 
的 原因 ， 只 考虑 每 场 比 赛 弱 旅 赢得 比赛 的 事件 是 相互 独立 的 ， 概 率 为 P。 要 赢得 
世界 大 赛 就 要 在 七 场 比赛 中 获胜 四 场 ， 如 果 在 前 几 场 提前 赢 了 四 场 比 赛 ， 剩 下 的 
比赛 就 不 用 继续 了 。 因 此 就 有 四 种 不 同 的 情形 可 以 赢得 大 赛 : 连续 赢 四 场 ; 前 四 
场 中 说 三 场 ， 第 五 场 再 说 ;前 五 场 中 启 三 场 ， 第 六 场 青 启 ; 前 六 场 中 说 三 场 ， 第 
七 场 青 说 。 每 一 种 情况 中 最 后 一 场 比 赛 肯 定 会 说 ， 概 率 就 为 p; 不 同 的 分 别 在 前 
三 、 四 、 五 、 六 会 说 三 场 ， 即 二 项 式 分 布 的 n 的 值 分 别 为 3、4、5、6。 那 么 弱 旅 
会 慑 的 概率 为 






































P( 级 旅 记得 世界 大 赛 ) = 之 Ci x px (1 -Pa xp 

然后 再 代 和 人 不 同 的 p。 

表 1-2 对 比 了 弱 旅 在 超级 杯 和 世界 大 赛 获胜 的 概率 。 从 表 中 可 以 看 出 对 于 弱 
旅 来 说 赢得 超级 杯 的 概率 总 是 要 比 赢得 世界 大 赛 的 概率 高 ; 实力 强 的 队伍 适合 赛 
制 多 的 比赛 。 比 如 一 个 球 队 每 场 比赛 赢 的 概率 为 145， 那么 它 在 世界 大 赛 中 夺冠 
的 概率 只 有 3.3% 。 所 以 在 超级 杯 中 爆 冷 获胜 的 概率 更 高 。 读 者 不 妨 用 历届 比赛 
的 结果 来 验证 一 下 吧 。 

表 1-2 弱 旅 赢得 超级 杯 和 世界 大 赛 的 概率 


P ( 单 场 取 胜 ) 50% 40% 30% 20% 10% 





P (赢得 超级 杯 ) 50% 40% 30% 20% 10% 


P (赢得 世界 大 赛 ) 50% 29% 13% 3.3% 0.3% 
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的 1.10 结语 


第 1 章 的 导论 就 介绍 到 这 里 了 。 你 现在 已 经 用 概率 知识 武装 好 了 头脑 ， 知 道 
如 何 把 一 般 问题 转化 成 概率 问题 ， 然 后 计算 出 来 。 接 下 来 就 赶紧 练 练 手 吧 。 
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神奇 的 概率 : 
直觉 不 可 靠 




















中 最 著名 的 要 数 






































9 觉 相 违 悖 的 例子 。 
































5 我 们 日 常 的 




































































想到 在 某 些 特 殊 的 决 























情况 下 ， 要 想 生 还 的 最 优 策略 







































































有 觉 不 可 靠 的 时 人 

















EE 如 何 发 挥 作用 的 吧 。 











和 看 译 
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2.1 男孩 、 女 孩 、A 牌 与 彩色 卡片 


概率 问题 看 似 简 单 ， 但 其 解决 的 方法 却 很 容易 引起 混 消 ， 以 至 于 产生 激烈 的 
争论 甚至 是 隔 空 的 齐 号 。 这 让 概率 背 上 了 不 好 的 名 声 。 虽 然 我 没有 目睹 过 因为 讨 
论 概率 问题 双方 拳脚 相 加 ， 但 是 我 并 不 认为 这 种 情况 不 会 发 生 。 许 多 混淆 都 是 由 
于 问题 本 身 没有 很 好 地 设计 ， 有 很 多 种 解释 方法 。 概 率 问题 通常 都 来 源 于 现实 生 
活 ， 这 是 与 其 他 数学 分 支 不 太一 样 的 地 方 。 你 可 以 赁 着 自己 的 生活 经 验 去 理解 问 
题 ， 提 出 解决 的 方案 ,不 需要 任何 正式 的 概率 学 的 背景 知识 。 让 我 们 用 一 个 典型 
的 问题 来 拉 开 本 章 的 序幕 吧 。 

这 一 次 简 阿 姨 又 来 电话 了 ， 说 她 的 新 邻居 有 两 个 孩子 ， 其 中 至 少 有 一 个 是 男 
孩 ， 那 么 另外 一 个 也 是 男孩 的 概率 是 多 少 ? 

你 跟 艾 伯 特 和 贝 琪 就 这 个 问题 在 酒吧 里 展开 了 讨论 。 你 认为 一 个 孩子 是 男孩 
跟 男 外 一 个 孩子 是 否 也 是 男孩 的 事件 是 相互 独立 的 ， 因 此 很 容易 得 出 概率 为 1/2。 
艾 伯 特 用 了 更 为 系统 的 方法 。 他 列 出 了 四 种 所 有 可 能 的 情况 BB、BG、GB、G6G,， 
同时 因为 有 一 个 孩子 肯定 是 男孩 所 以 排除 了 GG 这 种 不 可 能 的 情况 。 艾 伯 特 认为 
概率 是 173 ， 贝 琪 随意 说 了 一 个 数字 1， 酒 保 鲍 勃 随口 党 了 0， 喝 醉 的 袋 西 觉得 应 
该 是 0.73 〈 这 是 个 笠 运 数字 ) ， 那 么 谁 是 对 的 呢 ? 

事实 上 谁 说 的 都 有 可 能 。 这 取决 于 我 们 做 出 了 什么 样 的 假设 以 及 简 阿 姨 是 从 
何 处 得 到 这 些 信息 的 。 让 我 们 先 从 艾 伯 特 的 分 析 方 法 入 手 吧 。 首 先 ， 他 假设 四 种 
情况 是 等 可 能 事件 ， 这 个 假设 是 合理 的 。 然 后 他 根据 “至 少 有 一 个 是 男孩 ”的 
信息 得 到 概率 是 1/3 。 但 是 简 阿姨 是 怎么 知道 的 呢 ? 也 许 她 问 了 她 的 邻居 是 否 有 
儿子 ， 并且 得 到 了 肯定 的 答复 。 这 时 艾 伯 特 的 结论 是 正确 的 。 因 为 这 个 信息 可 以 
让 我 们 排除 GG 这 种 情况 而 只 剩 下 三 种 可 能 的 情况 。 

如 果 简 阿姨 随后 看 到 了 邻居 家 的 母亲 跟 一 个 小 男孩 在 散步 ， 那 么 这 对 结论 有 
什么 改变 吗 ? 乍 一 想 似乎 没有 什么 事情 会 因此 而 改变 。 毕 竞 ， 她 已 经 知道 这 个 家 
庭 里 有 一 个 男孩 ， 她 的 观察 只 是 更 加 肯定 了 这 件 事情 。 但 是 看 到 一 个 特定 的 男孩 
这 个 事实 比 被 别人 告知 “至 少 有 一 个 男孩 ”传递 出 了 更 多 的 信息 。 我 们 需要 用 
到 样本 空间 来 考虑 这 个 问题 (与 1.9 节 讨 论 的 从 有 三 个 孩子 的 家 庭 选 一 个 女孩 的 
情况 类 似 ) 。 在 这 个 样本 空间 中 ， 我 们 必须 确定 哪 一 个 男孩 是 简 阿 姨 看 见 的 那个 
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男孩 ， 用 星 号 来 标记 这 个 特定 的 男孩 ， 得 出 样本 空间 
B*B，BB*，B*CG，GB* 

在 四 种 情况 中 有 两 种 情况 都 有 两 个 男孩 ， 因 此 只 要 能 确定 这 个 男孩 的 存在 ， 
事件 的 概率 都 为 1/2。 比 如 说 ， 简 阿姨 看 见 了 这 个 男孩 ， 简 阿姨 跟 这 个 男孩 打 过 
电话 ， 简 阿姨 捡 到 了 他 丢失 的 成 绩 单 。 因 为 此 时 需要 考虑 到 有 一 个 已 知 的 特定 男 
孩 ， 所 以 其 实 有 两 种 出 现 BB 的 情况 。 换 而 言 之 ， 另 外 一 个 孩子 的 性 别 与 这 个 已 
知 的 孩子 是 完全 无 关 的 ， 在 这 种 情况 下 你 的 结论 是 正确 的 。 在 不 对 简 阿 姨 的 话 做 
任何 其 他 说 明 的 前 提 之 下 ， 你 的 结论 是 符合 逻辑 的 。 

那么 贝 琪 给 出 的 概率 1 呢 ? 她 也 许 会 反 驶 我 们 认为 四 个 结果 是 等 概率 事 
件 的 假设 ， 因 为 母亲 如 果 有 一 个 听话 的 女儿 能 陪 她 散步 她 就 不 会 在 泥 地 里 追 
着 淘气 的 儿子 跑 。 这 就 使 得 事件 BG 和 BG” 的 概率 为 0, 事件 B*B 和 BB* 
的 概率 均 为 1/2。 显 然 ， 如 果 符 合 贝 琪 的 假设 ,那么 另外 一 个 孩子 显然 就 是 
男孩 了 。 

酒 保 鲍 勃 认为 一 个 母亲 绝对 不 会 只 带 一 个 儿子 出 来 散步 而 让 看 电视 的 父亲 有 照 
看 另外 一 个 用 蜡笔 在 墙 上 涂鸦 的 儿子 。 依 据 鲍 勃 的 理论 ， 如 果 母 亲 只 带 一 个 男 芒 
散步 ， 男 外 一 个 孩子 肯定 就 是 女儿 。 因 此 他 认为 事件 B"B 和 BB” 的 概率 为 0， 
而 BG 和 BG’ 各 自 的 概率 为 1/2。 

选择 0 到 1 之 间 的 任何 四 个 数字 ， 只 要 相 加 等 于 1 都 可 以 用 来 给 这 四 个 情况 
赋值 ， 包 括 集 西 随口 说 的 0.73。 你 可 以 再 来 一 品 脱 酒 庆祝 一 下 大 家 都 答对 了 
( 袋 西 就 不 要 再 喝 了 ， 她 已 经 喝 得 够 多 了 ) 。 每 个 人 出 于 自己 的 考虑 都 有 各 自 认 
为 最 正确 的 概率 分 配 ， 但 排除 这 些 顾 虑 ， 这 些 例 子 告诉 你 在 计算 概率 时 必须 要 明 
确 具 体 的 假设 前 提 。 在 上 述 的 例子 中 ,依据 不 同 的 假设 ,概率 会 不 确定 地 在 0 ~ 
1 之 间 变 动 。 

接 下 来 再 说 一 个 相关 的 问题 。 你 给 了 贝 琪 一 手 牌 ， 问 她 :“ 这 些 牌 里 有 A 
吗 ?” 她 回答 :“ 有 。” 那 么 她 的 牌 中 有 不 止 一 张 A 的 概率 是 多 少 呢 ? 接着 你 问 
她 :“ 你 有 黑 桃 A 吗 ?” 她 再 一 次 给 出 了 肯定 的 回答 。 现 在 她 手中 不 止 一 张 A 的 
概率 又 是 多 少 呢 ? 

就 像 上 文中 一 开始 介绍 男孩 的 例子 一 样 ， 这 两 个 信息 传递 出 来 的 含义 是 不 一 
样 的 。 当 确定 了 某 一 些 特 定 的 因素 后 ， 信 息 能 传达 出 更 多 的 含义 。 前 者 表达 的 含 
义 是 : 当 我 们 知道 至 少 有 一 张 A 时 ， 这 一 手 牌 中 有 不 止 一 个 A 的 概率 是 多 少 。 
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而 后 者 是 给 出 了 一 张 特定 的 A， 然 后 计算 不 止 一 个 A 的 概率 。 为 了 简化 这 个 问 
题 ， 我 们 假设 一 副 牌 中 只 有 四 张 牌 %A，YA， 唱 8 和 O05， 给 了 贝 琪 两 张 牌 。 
此 贝 琪 手中 持 有 的 牌 型 共有 6 种 可 能 的 情况 : 

(AAVA), (MAS8), (HAO5) (VA®8), (VAO05), (B805) 

如 果 她 对 “这 些 牌 里 有 A 吗 ?” 这 个 问题 给 出 了 肯定 的 回答 ， 那 么 就 排除 了 
( 品 805) 这 种 情形 。 剩 下 的 五 种 可 能 情形 中 ， 只 有 一 种 情形 有 两 个 A， 这 种 情 
形 的 条 件 概率 是 1/5。 如 果 问 她 “你 有 黑 桃 A 吗 ?” 她 回答 : “有 。” 那 么 有 三 种 
牌 型 都 被 排除 了 ， 此 时 有 两 张 A 的 条 件 概 率 为 1/3。 

我 希望 借 这 个 简化 的 例子 可 以 让 你 明白 ， 即 使 原来 是 用 一 副 完 整 的 牌 来 计算 
两 个 条 件 概 率 也 适用 同样 的 原理 ， 只 不 过 是 更 加 复杂 一 点 而 已 。 瓦 伦 韦 弗 在 
《 垃 运 女神 》(Lady Luck) 一 书 中 也 举 了 这 个 例子 ， 并 将 这 个 问题 及 其 解法 归功 
于 马丁 加 德 纳 这 位 美国 趣味 数学 领域 的 无 蝎 之 王 。 加 德 纳 从 1956 年 开始 ， 连 
续 25 年 在 《科学 美国 人 》 杂 志 中 开设 “魔法 数学 ”专栏 ， 致 力 于 将 深奥 的 数学 
介绍 给 普通 大 众 。 说 来 也 奇怪 ， 韦 弗 先生 也 表达 了 “至 少 一 个 A” 和 “ 黑 桃 A” 
这 两 种 表述 之 间 存 在 区 别 的 类 似 观 点 ， 他 认为 : 

“但 是 加 德 纳 先生 的 推理 真 的 合理 吗 ? 第 一 种 情况 下 的 五 种 牌 型 与 第 二 种 情 
况 下 的 三 种 牌 型 是 等 可 能 的 吗 ?” 

答案 是 肯定 的 。 简 化 的 四 张 牌 的 例子 已 经 很 好 地 诠释 了 这 个 问题 .2 万 弗 先 
生 之 所 以 对 加 德 纳 先 生 的 理论 持 怀 疑 态 度 在 于 《地 运 女 神 》 一 书 中 提出 的 男 一 
个 问题 。 接 下 来 我 们 来 看 一 看 这 个 问题 吧 。 

盒子 里 放 着 三 张 卡 片 。 一 张 卡片 两 面 都 是 红色 的 ， 一 张 卡片 两 面 都 是 黑色 ， 
剩 下 的 一 张 卡 片 一 面 是 红色 一 面 是 黑色 。 现 在 随机 抽出 一 张 卡片 ， 并 展示 它 一 面 
的 颜色 。 假 设 是 红色 ， 那 么 剩 下 的 一 面 也 是 红色 的 概率 是 多 少 呢 ? 

答案 显而易见 。 你 随意 从 三 张 卡片 中 抽出 一 张 ， 抽 到 任何 一 张 都 是 等 概率 
的 。 如 果 抽 出 的 这 张 有 一 面 是 红色 ， 那 么 这 张 卡 片 有 可 能 是 两 面 全 是 红色 的 那 张 
卡片 ， 也 可 能 是 一 面 红 一 面 黑 的 那 张 卡 片 ， 因 此 抽 到 的 是 两 面 全 红 的 那 张 卡片 的 



































”加 德 纳 先 生 用 的 是 桥牌 而 不 是 普通 的 扑克 牌 来 举例 。 我 完全 不 懂 怎 么 玩 桥 牌 。 我 唯一 一 次 与 桥牌 
近 距 离 接触 还 是 我 在 大 学 的 暑期 实习 中 与 精神 诊疗 院 的 病人 一 块 玩 的 简易 版 本 。 但 是 当 他 们 告诉 
我 ， 我 的 水 平 是 白痴 级 别 的， 我 深 受 打击 再 也 不 玩 了 。 
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概率 是 1/2。 不 费 吹 灰 之 力 。 但 是 等 等 ， 还 有 个 问题 。 如 果 展 示 出 来 的 那 一 面 是 
黑色 ,那么 抽 到 两 面 全 黑 的 卡片 的 概率 也 是 1/2。 所 以 不 管 我 们 看 到 的 是 什么 颜 
色 ， 抽 到 两 面 同色 的 卡片 的 概率 都 是 1/2。 这 就 意味 着 我 们 虽然 三 张 卡片 中 有 两 
张 是 两 面 同色 的 卡片 ,但 是 我 们 随机 抽 到 的 概率 还 只 是 1/2。 肯 定 有 什么 地 方 出 
错 了 ,但 是 问题 出 在 哪儿 呢 ? 

问题 就 在 于 没有 分 清楚 条 件 概率 与 非 条 件 概率 。 一 开始 两 面 红 色 的 卡片 与 一 
面 红 一 面 黑 的 卡片 被 选中 的 概率 是 相等 的 ， 这 意味 着 在 非 条 件 概 率 的 情况 下 ， 两 
者 是 等 可 能 事件 。 但 是 ， 当 我 们 知道 抽出 的 卡片 有 一 面 是 红色 时 ， 两 面 红 色 的 卡 
片 与 一 面 红 一 面 墨 的 卡片 被 选中 的 概率 就 不 再 相等 了 。 为 什么 呢 ? 这 种 情况 与 我 
们 之 前 讨论 过 的 有 一 个 特定 的 孩子 的 问题 是 一 样 的 ， 只 不 过 在 这 个 问题 中 我 们 要 
考虑 的 是 已 经 看 到 某 张 卡片 特定 的 一 面 。 因 为 每 张 卡片 的 两 面 都 有 颜色 ， 并 且 用 
星 号 标记 出 已 经 展示 的 特定 面 对 颜色 ， 我 们 得 到 了 如 下 的 样本 空间 : 

R*R，RR*，R*B，RB*，B*B，BB* 

现在 我 们 就 可 以 很 方便 地 计算 出 任何 我 们 想 要 的 概率 了 。 因 为 上 述 样本 空间 
中 有 三 种 情形 包含 了 R  ， 其 中 的 两 种 情形 是 与 R 结合 的 ， 所 以 当 展 示 出 来 的 一 
面 是 红色 时 ， 抽 到 的 卡片 两 面 都 是 红色 的 概率 为 2/3。 而 如 果 至 少 有 一 面 是 红 
色 ， 抽 到 两 面 都 是 红色 的 那 张 卡片 的 概率 则 只 有 1/2， 因 为 在 这 种 情况 也 包括 了 
RB"。 但 是 这 种 解释 的 方法 却 不 是 我 出 这 道 题 的 本 意 。 

瓦 伦 . 韦 弗 发 现 了 扑克 牌 问题 与 卡片 问题 之 间 的 相似 之 处 。 在 卡片 问题 中 ， 
一 开始 两 面 是 红色 的 卡片 与 一 面 是 红色 一 面 是 黑色 的 卡片 被 选中 的 概率 是 一 样 
的 ， 但 当 两 面 是 黑色 的 卡片 被 完全 排除 了 之 后 ， 它 们 被 选中 的 概率 就 不 相等 了 。 
这 个 发 现 带 来 了 一 个 新 间 题 : 排除 了 某 些 扑克 牌 出 现 的 可 能 性 是 否 会 使 得 剩 下 的 
牌 出 现 的 概率 变 得 不 相等 呢 ? 正如 我 们 刚才 列 出 的 这 些 有 颜色 的 卡片 最 终 有 6 种 
可 能 的 情形 ， 当 展示 出 来 的 一 面 是 红色 时 ， 我 们 排除 了 3 种 情形 ， 而 不 是 从 三 张 卡 
片 中 排除 了 一 张 。 事 实 上 简化 版 的 四 张 扑 克 牌 问题 也 有 六 种 可 能 出 现 的 情形 ， 从 这 
个 角度 上 说 这 与 卡片 问题 是 类 似 的 ， 但 绝 不 是 韦 弗 理解 的 那 种 意义 上 的 相似 。 

用 经 验 事实 一 一 去 验证 这 些 概 率 非常 的 简单 (在 计算 机 上 运行 会 更 快 )。 用 
四 张 扑 克 牌 来 解决 扑克 牌 问 题 。 反 复 地 洗 牌 ， 每 次 从 中 抽取 两 张 。 忽 略 没有 抽 到 
A 的 情形 ， 计 算 你 至 少 抽 到 一 张 A 的 次 数 ， 用 NN 来 代替 这 个 数字 。 同 理 ， 计 算 
你 抽 中 黑 桃 A 的 次 数 ， 用 4 来 代替 ; 用 了 来 表示 你 抽 到 两 张 A 的 次 数 。 反 复试 
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验 之 后 ，7VN 的 值 应 当 趋 近 于 1/5， 而 74 则 趋 近 于 173 。 
2.2 山羊 与 幸灾乐祸 ( 蒙 提 霍 尔 问题 ) 


最 著名 的 概率 问题 也 许 就 是 蒙 提 霍 尔 问题 (Monty Hall problem ) 。 来 源 于 蒙 
提 霍 尔 主持 的 “让 我 们 做 笔 交 易 ” 游 戏 秀 ， 通过 一 个 世界 上 最 聪明 的 人 和 几 个 
粗 吕 的 数学 家 利用 一 辆 车 、 两 只 山羊 给 全 世界 人 民 创 造 了 茶余饭后 的 谈资 。 参 赛 
者 需要 从 三 鹿 门 中 选择 出 一 扇 门 ， 其 中 一 肩 的 后 面 有 一 辆 汽车 ， 另 外 两 肩 门 后 
面 则 各 藏 有 一 只 山羊 。 当 参赛 者 选 定 了 一 鹿 门 ， 还 未 去 开启 它 前 ， 节 目 主持 
人 开启 剩 下 两 扇 门 中 的 一 扇 ， 露 出 了 一 只 山羊 。 然 后 主持 人 会 问 参赛 者 ， 是 
继续 坚持 之 前 的 选择 还 是 换 另 一 扇 还 未 打开 的 门 。 问 题 的 关键 在 于 换 另 一 扇 
门 是 否 有 利于 参赛 者 赢得 汽车 呢 ? 

乍 看 之 下 这 并 不 影响 参赛 者 赢得 汽车 的 概率 ， 因 为 两 扇 门 中 只 有 一 鹿 后 面 有 
汽车 。 但 是 因为 蒙 提 霍 尔 知道 汽车 在 哪 扇 门 后 ， 所 以 他 总 是 会 先 打开 一 扇 后 面 藏 
着 羊 的 门 。 如 果 这 时 你 选择 换 另 外 一 扇 门 的 话 ， 就 意味 着 不 论 你 最 初 选择 的 门 后 
是 否 藏 着 山羊 ， 你 赢得 汽车 的 概率 都 是 2/3。 所 以 ， 如 果 你 换 另 一 扇 门 是 更 有 利 
的 。 因 为 这 个 问题 被 反复 地 讨论 ， 炒 作 解 释 ， 在 此 我 不 细 究 了 。 许 多 网 站 和 书籍 
上 都 提供 了 各 种 解释 甚至 还 作出 了 延伸 讨论 ， 有 些 网 站 还 开设 了 这 个 游戏 。 上 网 
搜索 一 下 就 可 以 找到 。 我 要 做 的 事 是 解释 对 这 个 问题 从 根源 上 产生 的 分 歧 。 首 
先 ， 让 我 们 回顾 一 下 这 个 问题 发 展 的 历史 。 

1991 年 《展示 杂志 》 (Parade Magazine)“ 问 问 玛 丽 莲 ”( Ask Marilyn) 专栏 
中 刊登 了 这 个 问题 ， 从 此 之 后 蒙 提 霍 尔 问 题 得 到 了 世人 的 关注 。 这 就 是 玛丽 莲 。 
沃 斯 . 莎 凡 特 ( Marilyn vos Savant) 从 20 世纪 80 年 代 开始 就 写 的 专栏 ， 这 位 女 
性 保持 着 吉 尼 斯 世界 纪录 最 高 智商 的 记录 (228) 中 。 玛 丽 莲 对 这 个 问题 进行 了 解 
释 ， 说 明 为 什么 换 一 个 门 更 加 有 利 。 大 量 的 数学 家 随即 对 她 的 解释 进行 择 击 ， 声 













































































”最 高 智商 的 纪录 再 也 没有 被 刷新 过 ， 玛 丽 莲 ( Marilyn) 也 跻身 吉 尼 斯 世界 名 人 和 堂 。 现 在 测试 分 数 
的 门槛 被 降低 了 ， 像 玛丽 莲 这 样 高 的 智商 已 经 无 法 记录 了 。 这 么 高 的 智商 得 分 究 竞 有 什么 意义 还 
不 得 而 知 ， 但 是 成 为 世界 上 最 聪明 的 人 这 一 点 就 足以 让 人 洋洋 得 意 了 。 想 想 这 个 名 头 能 够 给 你 带 
来 的 机 会 …… 比 如 说 在 《展示 杂志 》 拥 有 自己 的 专栏 。 
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称 她 错 得 太 离谱 。 我 敢 打赌 这 些 数学 家 们 看 着 这 个 比 他 们 更 聪明 更 出 名 的 女人 在 
这 个 简单 的 问题 上 犯错 时 有 多 人 么 的 幸 灾 乐 神 。 有 些 人 甚至 把 矛头 指向 对 权威 的 育 
目 信 任 : 

“在 至 少 三 个 数学 家 对 你 犯 的 错误 进行 指正 之 后 ， 你 依然 坚持 你 错误 的 观点 。 
我 非常 震惊 。 

到 底 需 要 多 少数 学 家 发 疯 才 能 纠正 你 的 错误 呢 ? 

如 果 连 博士 都 要 出 错 ， 这 个 国家 也 要 完蛋 了 。 

有 一 些 人 就 更 加 粗鲁 了 ， 他 们 说 : 

“你 就 继续 吹牛 吧 ， 你 这 次 真是 牛皮 吹 太 大 了 ! ……… 你 连 最 基本 的 原则 都 搞 
不 清楚 …… 这 个 国家 已 经 有 够 多 的 数学 盲 了 ， 我 们 不 想 再 有 个 世界 上 智商 最 高 的 
人 来 次 数 ! 真 让 人 羞愧 1 

我 能 求 求 你 去 买 本 概率 教科 书 看 看 吗 ? 

我 相信 无 数 高 中 生 和 大 学 生 会 给 你 来 信 指 导 你 的 。 也 许 你 需要 再 多 用 几 个 地 
址 来 接收 这 些 帮 助 你 专栏 的 邮件 。” 

还 有 一 群 人 试图 用 一 种 更 加 “委婉 ”的 方式 来 理解 她 , “也 许 女 人 和 男人 看 
待 数学 问题 的 角度 不 一 样 吧 ”。 

事实 证 明 玛丽 莲 是 对 的 ， 而 这 些 数学 家 们 都 错 了 ， 幸 灾 乐 祸 的 人 最 后 只 得 到 
了 山羊 英国 统计 学 家 布 莱 恩 . 埃 弗 里 特 在 其 著作 《机 会 规则 : 概率 、 风 险 和 
统计 的 非 正 式 指南 》 (Chance rules: an informal guide to probability，risk，and sta- 
tistics) 中 介绍 了 蒙 提 霍 尔 问 题 ， 对 于 某 一 个 数学 家 他 评论 道 “ 他 依然 在 洗刷 着 
耻辱 ”。 我 们 就 不 再 落 井 下 石 了 。 人 们 也 许 会 对 这 些 来 信 中 严厉 刻薄 的 用 词 不 满 ， 
但 我 依然 要 为 这 些 数学 家 们 说 几 句 话 ， 我 也 许 太 善良 了 。 因 为 蒙 提 霍 尔 随机 选择 
的 门 后 面 有 一 只 山羊 ， 他 们 都 本 能 地 运用 了 条 件 概率 。 但 是 这 是 不 同 的 。 我 们 假 
设 你 每 次 都 会 选择 换 一 扇 门 ， 然 后 再 来 看 这 个 问题 。 

如 果 你 和 蒙 提 霍 尔 都 是 随机 选择 一 扇 门 ， 那 么 有 三 种 等 可 能 的 结果 (你 先 选 

































































”许多 持 反对 意见 的 数学 家 拥有 很 高 的 学 术 地 位 : 保罗 . 厄 多 斯 (1913 一 1996) ， 作 为 20 世纪 最 伟 
大 的 数学 家 之 一 ， 不 赞同 参赛 者 换 一 扁 门 说 的 概率 更 高 。 在 保罗 : 霍 夫 曼 写 的 厄 多 斯 传记 《他 只 
爱 数字 》 (The Man Who Loved Only Numbers) 一 书 中 详细 介绍 了 厄 多 斯 关于 蒙 提 霍 尔 问题 的 观点 
以 及 这 位 伟大 的 数学 家 在 朋友 用 计算 机 模拟 该 问题 计算 之 后 终于 承认 换 一 扇 门 赢 的 概率 更 高 。 
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择 ) : 车 /山羊 ， 山 羊 / 车 ， 山 羊 / 山 羊 。 为 什么 是 等 可 能 呢 ? 你 选中 车 的 概率 是 
1/Z3 ， 蒙 提 霍 尔 只 能 选 到 山羊 。 你 选中 山羊 的 概率 是 2/3 ， 在 这 样 的 前 提 下 ， 蒙 提 
霍 尔 选 到 山羊 和 车 的 概率 都 是 1/2。 如 果 蒙 提 霍 尔 随机 选择 了 一 扇 藏 着 山羊 的 
门 ， 山 羊 / 车 这 个 组 合 就 会 被 排除 ， 剩 下 的 车 /山羊 和 山羊 /山羊 的 组 合 依 然 是 等 可 
能 的 。 一 种 情况 你 会 启 ， 另 一 种 情况 你 会 输 ， 所 以 你 赢 的 概率 是 1/2。 提 醒 大 家 注 
意 的 是 ， 蒙 提 霍 尔 有 可 能 随机 选择 的 一 扇 门 就 是 藏 着 车 的 那 扇 门 ， 但 只 不 过 在 游戏 
中 他 绝 不 会 选择 那 扇 门 。 你 可 以 想象 一 下 反复 玩 这 个 游戏 ， 然 后 排除 蒙 提 霍 尔 一 开 
台 就 随机 选中 这 扇 背 后 藏 着 车 的 门 的 情况 。 这 种 情况 发 生 的 概率 大 概 是 1/3， 剩 下 
的 273 的 概率 中 你 有 一 半 的 机 会 赢 。 这 在 游戏 秀 中 自然 可 以 解释 成 : 蒙 提 霍 尔 事先 
知道 车 在 哪 一 扇 背后 ， 他 总 是 会 先 打 开 一 扇 背 后 藏 着 山羊 的 门 。 因 此 在 游戏 秀 中 山 
羊 /车 这 一 组 合 出 现 的 概率 为 0， 你 通过 山羊 /山羊 的 组 合 赢 的 概率 是 2/3 。 

在 蒙 提 霍 尔 问题 中 还 存在 一 种 心理 因素 的 影响 ， 即 如 果 你 换 了 门 发 现 后 面 是 
一 只 山羊 ， 你 会 非常 的 后 悔 。 这 让 你 感觉 你 用 一 辆 车 去 换 了 一 只 山羊 。 如 果 你 坚 
持 最 初 的 选择 ， 发 现 那 遍 门 之 后 是 山羊 ， 你 至 少 表现 出 了 自己 坚持 的 一 面 ， 不 会 
左右 摇摆 犹 隐 不 决 。 这 一 点 非常 值得 骄 做 。 也 许 我 们 应 当 把 这 种 “挫折 因素 ” 
量化 ， 并 在 解决 问题 时 慎重 考虑 到 这 个 因素 。 

这 一 类 的 概率 问题 并 不 是 由 玛丽 莲 或 是 蒙 提 霍 尔 首先 提出 的 。 另 外 一 个 实质 
上 完全 相同 的 问题 于 1959 年 以 “三 因 犯 间 题 ” (three prisoners problem) 的 形式 
由 马丁 . 加 德 纳 提出 。 我 也 用 圣经 故事 重新 演绎 了 这 个 问题 ， 尼 布 甲 尼 撒 王 决 定 
随机 赦免 沙 德 拉 、 米 黎 和 亚 伯 尼 歌 中 的 一 人 ， 使 其 免 受 扔 进 火 寅 的 责 罚 。 亚 伯 尼 
歌 显然 比 他 的 朋友 更 担心 自己 ， 他 问 尼 布 甲 尼 撒 王 他 会 不 会 被 赦免 。 尼 布 甲 尼 投 
王 不 想 回答 这 个 问题 ， 但 是 他 告诉 亚 伯 尼 歌 ， 沙 德 拉 是 不 会 被 赦免 的 。 这 个 回答 
好 歹 也 让 亚 伯 尼 歌 松 了 一 口气 ， 因 为 这 样 他 得 以 赦免 的 概率 从 173 提高 到 了 1/2。 
这 个 问题 将 留 给 读者 自己 去 研究 ， 你 会 从 中 发 现 它 与 蒙 提 霍 尔 问 题 的 相似 之 处 ， 
从 而 让 亚 伯 尼 歌 的 幻想 破灭 。 


















































2.3 生日 问题 


对 于 很 多 概率 问题 (即使 是 非常 简单 的 日 常 问题 ) ， 人 们 也 很 难 迅 速 得 出 正 
确 的 答案 ， 这 也 是 概率 问题 不 同 于 其 他 日 常数 学 问题 之 处 。 例 如 ， 我 们 每 天 都 要 
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完成 很 多 预定 好 的 活动 (上课 、 工 作 、 旅 行 等 )， 我 们 能 很 好 地 估算 某 一 项 活动 
大 概 需要 用 的 时 间 。 也 许 我 们 从 来 没有 从 纽约 开车 去 芝加哥 ， 但 是 要 估算 出 这 
路 大 概 需要 花 多 长 的 时 间 也 不 是 一 件 困 难 的 事 。 如 果 有 人 说 大 概要 花 两 周 的 时 
间 ， 我 们 就 会 觉得 非常 可 笑 。 同 样 ， 我 们 也 能 轻松 地 估算 出 长 度 、 面 积 和 容积 这 
一 类 物理 量 。 你 根本 不 用 为 在 餐厅 里 面 吃 一 顿 饭 该 付 多 少 小 费 而 烦恼 。 如 果 你 需 
要 在 一 下 午 把 家 具 全 搬出 屋子 ， 你 大 概要 叫 五 六 个 朋友 来 帮 你 。 但 是 如 果 需 要 保 
证 至 少 两 个 人 的 生日 为 同一 天 的 概率 不 小 于 5$0% ， 最 少 要 多 少 个 人 呢 ? 

你 也 许 早 就 知道 答案 了 ， 毕 竟 这 是 一 个 经 典 问题 。 但 即使 你 知道 这 个 数字 ， 
你 能 说 这 是 你 估算 出 来 的 吗 ? 我 们 当然 不 具备 这 样 的 现实 经 验 ， 没 有 人 会 闲 得 去 
统计 多 少 个 人 中 才 会 出 现 两 个 人 的 生日 为 同一 天 。 让 我 们 做 一 点 小 小 的 假设 ,来 
看 看 这 个 问题 是 如 何 解决 的 。 首 先 我 们 假设 一 年 有 365 天 (将 2 月 29 日 排除 ) ， 
接着 需要 假设 所 有 随机 选择 的 人 们 在 每 一 天 出 生 的 概率 都 是 等 可 能 的 。 现 在 可 以 
运用 到 第 一 法 则 了 ， 先 计算 每 个 人 都 在 不 同一 天 出 生 的 概率 ， 然 后 再 用 1 减 去 这 
个 数字 就 得 到 了 我 们 需要 的 概率 。 先 看 看 只 有 两 个 人 的 情况 。 第 一 个 人 可 以 随便 
在 哪 一 天 生日 ， 第 二 个 人 只 需要 避 开 这 一 天 生日 就 可 以 ,概率 是 364/365。 所 以 
两 个 人 在 同一 天 出 生 的 概率 是 1 -364/365 ~~0. 003。 

然后 再 加 一 个 人 ,他 (她) 的 生日 必须 避 开 前 面 两 个 人 的 生日 ， 概 率 变 为 
363/365。 那 么 三 个 人 在 不 同 的 日 期 生日 的 概率 是 364/365 x363/365 (我 们 用 的 
是 1.5 节 中 介绍 的 条 件 概率 中 用 到 的 乘法 法 则 ) ， 那 么 这 三 个 人 中 有 人 在 同一 天 
生日 的 概率 是 

364 、363 


玉 二 有 大 在 同一 天香 目 ) 1 一 3 Xcel 


通过 这 种 方法 我 们 认识 到 个 人 中 有 人 在 同一 天 生日 的 概率 为 


a 364_363 (366-n) 
P (有 人 在 同一 天 生日 ) =1 0 es 


随 着 的 值 不 断 变 大 ， 这 个 数字 也 迅速 地 变 大 。 当 n 分 别 等 于 4、5、6、7 
时 ， 概 率 分 别 是 0.02、0.03、0.04 和 0. 06。 当 有 10 个 人 时 ， 概 率 已 经 超过 0.1 
了 ; 当 nn 等 于 22 时 ,概率 为 0.48， 当 nn 等 于 23 时 ， 有 人 在 同一 天 生日 的 概率 为 
0. 51。 因 此 仅仅 需要 23 个 人 就 可 以 保证 有 人 在 同一 天 生日 的 事件 发 生 的 概率 至 
少 有 50% 。 太 不 可 思议 了 ， 难 道 不 是 吗 ? 用 一 个 实际 例子 来 验证 一 下 ,我 从 
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2006 年 全 国 橄榄 球 联盟 每 个 球 队 的 首发 球员 中 挑 了 23 个 人 ,， 查 了 一 下 他 们 的 生 
日 (亲爱 的 读者 ， 为 了 你 们 我 真 的 很 努力 地 工作 着 ) 。32 支 球 队 中 ， 我 发 现 17 
个 人 中 就 有 至 少 两 个 人 在 同一 天 出 生 。 当 然 我 们 不 能 期 望 每 一 次 实证 检验 的 结 
都 这 么 详尽 ， 但 我 依然 非常 欣喜 第 一 次 尝试 就 找到 了 这 种 理论 与 实际 能 够 完美 吻 
合 的 例子 。 在 表 2-1 中 列 出 了 不 同人 数 的 情况 下 至 少 有 两 个 人 在 同一 天 生日 的 
概率 。 

表 2-1 同一 天 生日 的 概率 ( 以 百分比 的 形式 ) 


人 数 5 10 22 23 30 50 








PP (同一 天 生日 ) 2.7% 11.7% 47.6% 50.7% 70.6% 97.0% 





我 猿 大 部 分 人 一 开始 猿 出 现 两 人 同一 天 生日 的 概率 为 50% 时 的 数字 应 该 是 
183 左右 的 数字 ， 也 就 是 半年 的 天 数 。 有 意思 的 是 在 表 2-1 中 ， 这 个 数字 为 23， 
23 可 比 183 小 很 多 。 有 时 在 课 演 里 我 问 过 学 生 100 个 人 中 至 少 有 两 人 在 同一 天 出 
生 的 概率 是 多 少 。 我 画 了 一 条 线 ， 端 点 分 别 是 0 和 1。 我 用 教鞭 从 0 开始 缓慢 向 
1 滑动 ， 当 我 滑 到 学 生 们 心中 所 想 的 概率 时 ， 同 意 的 人 举 手 示意 。 通 常 当 我 滑 到 
1/4 到 1/3 之 间 是 ， 大 部 分 人 会 举 手 〈 这 个 问题 我 在 瑞典 和 美国 都 试验 过 ， 所 以 
不 用 担心 存在 文化 差异 问题 ) 。 这 个 问题 回答 的 正确 率 是 0. 9999997 。 

想象 一 下 我 现在 坐 在 瑞典 大 一 的 课堂 里 ， 手 边 有 十 个 班 的 花 名 册 ， 每 个 班 大 
约 有 20 ~ 25 个 孩子 。 我 需要 核对 有 多 少 个 班 中 有 和 孩子 跟 我 是 同一 天 生日 的 。 根 
据 我 们 上 面 计算 出 来 的 结果 ， 大 概 有 五 个 班 左右 符合 要 求 。 但 是 事实 上 出 乎 我 的 
意料 ， 一 个 班 也 没有 。 难 道 是 我 的 运气 太 差 了 吗 ? 

不 是 的 ， 这 个 结果 也 应 当 在 预料 之 中 。 计 算 一 个 人 与 另外 一 个 人 的 生日 重合 
的 概率 与 计算 某 一 个 人 在 特定 某 一 天 生日 的 概率 是 完全 不 同 的 。 在 计算 前 一 个 概 
率 时 必须 要 保证 每 一 个 新 加 入 的 成 员 避 开 之 前 成 员 的 生日 。 后 一 种 情况 下 ， 只 要 
避 开 某 一 特定 的 日 期 就 可 以 了 ， 每 一 次 的 概率 都 是 364/365。 计 算 23 个 人 (不 包 
括 我 ) 中 有 人 与 我 同一 天 生日 的 概率 需要 用 到 第 一 法 则 ， 即 

P( 有 人 与 我 同一 天 生日 ) =1 - P( 没 人 与 我 同一 天 生日 ) 

=1 - (364/365)” ~0. 06 
得 出 来 的 结果 与 0. 51 相差 甚 远 。 那 么 至 少 要 多 少 个 人 才能 保证 其 中 有 人 与 我 的 
生日 是 同一 天 的 概率 超过 0. 5 呢 ? 用 252 来 代替 23 这 个 指数 ， 计 算出 来 的 结 
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比 0.5 略 小 一 些 ; 用 253 来 代替 则 结果 刚好 超过 0.5。 因 此 ， 需 要 253 个 人 才能 
保证 其 中 有 人 与 我 的 生日 是 同一 天 的 概率 超过 0.5， 这 个 数字 远 远 大 于 23 。 

人 们 只 注意 到 23 和 253 都 与 183 相去 甚 远 , 但 却 没有 注意 到 它们 之 间 存 在 
着 有 意思 的 联系 。 这 种 联系 可 以 从 生日 重合 的 可 能 性 角度 考虑 。 让 我 来 详细 解释 
一 下 。 首 先 需 要 考虑 我 的 生日 ， 我 们 已 经 知道 如 果 与 其 他 253 个 人 一 一 对 比 ， 有 
50 对 50 的 机 会 能 够 匹配 。 这 时 我 们 就 形成 了 253 个 生日 对 ， 在 这 些 生日 对 中 寻 
找 匹配 的 生日 对 。 而 如 果 我 们 想 要 找 的 并 不 是 与 我 同一 天 生日 ， 而 是 一 群 人 各 自 
之 间 存 在 匹配 的 生日 ， 我 们 需要 把 每 一 个 人 与 剩 下 的 其 他 人 配对 ， 形 成 所 有 可 能 
的 生日 对 。 那 么 23 个 人 一 共有 多 少 生 日 对 呢 ? 还 记得 我 们 在 上 一 章 学 习 的 组 合 
知识 吗 ? 这 个 数字 是 C3 ， 即 23 x 22/2 ， 恰 好 等 于 253。 因 此 ，23 个 人 可 以 形成 
253 个 生日 对 ， 其 中 至 少 两 人 在 同一 天 出 生 的 概率 是 0. 5。 

尽管 上 面 的 论据 非常 有 用 并 给 人 以 启发 ,但 是 其 中 还 是 包含 着 一 点 点 欺骗 性 
的 内 容 。 想 一 想 我 们 是 如 何 计算 “ 有 人 跟 我 是 同一 天 生日 ”的 ,用 1 - (364/ 
365 )”。 因 为 每 个 人 的 生日 都 是 独立 的 ， 所 以 需要 反复 将 364/365 乘 以 364/365。 
每 一 对 生日 对 从 这 种 意义 上 说 都 是 独立 事件 ， 因 为 “我 与 一 个 人 同一 天 生日 ” 
与 “ 男 一 个 人 是 否 会 与 我 在 同一 天 生日 ”完全 没有 关系 (除非 这 些 人 是 按 某 种 
特别 的 要 求 选 出 来 的 ， 比 如 说 2 月 29 日 出 生 人 员 大 会 ) 。 从 23 个 人 中 我 们 可 以 
得 到 253 对 生日 对 ， 这 些 生 日 对 却 不 是 完全 独立 的 。 比 如 我 与 弗 雷 迪 . 墨 丘 利 
的 生日 是 同一 天 ， 而 他 又 与 杰 西 . 詹姆斯 (电影 《不 法 之 徒 》 的 男 主角 ) 的 
生日 一 样 ， 所 以 我 与 杰 西 : 詹姆斯 也 是 同一 天 出 生 的 。 但 是 大 部 分 的 生日 对 之 
间 还 是 互相 独立 的 。 我 和 弗 雷 迪 在 同一 天 生日 ， 而 我 又 被 告知 麦当娜 与 查 尔 
斯 . 布 考 斯 基 在 同一 天 生日 (事实 也 是 如 此 )， 这 与 麦当娜 和 我 是 否 在 同一 天 
生日 毫 无 关系 (事实 上 我 们 不 在 同一 天 生日 )。 而 这 种 互相 独立 的 生日 对 足够 
的 多 ， 这 个 论据 是 一 个 无 限 接近 的 近似 值 ， 所 以 也 是 有 效 的 (从 这 里 我 们 也 可 
以 看 出 23 与 253 之 间 的 关系 ) 。 因 此 , nn 个 人 中 至 少 两 个 人 在 同一 天 生日 的 概 
率 的 近似 算法 是 






















































































P( 有 人 在 同一 天 生日 )~1 - | 


365 
这 个 公式 可 以 让 你 更 方便 地 计算 此 类 问题 的 概率 。 
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我 们 假设 在 每 一 天 生日 的 概率 都 是 等 可 能 的 ， 但 是 在 现实 生活 中 这 是 不 正确 
的 。 而 我 们 做 出 的 这 种 等 可 能 的 假设 也 使 得 “同一 天 生日 ”更 难 了 。 于 是 ,在 
现实 生活 中 正确 答案 会 是 一 个 比 23 还 要 小 的 数字 。 在 这 一 点 上 我 不 进行 完整 的 
数学 证 明了 ， 而 分 别 从 直觉 和 数学 两 个 角度 来 了 论证 。 希望 至 少 有 一 个 论据 可 以 
让 你 信服 。 

觉 上 论证 : 考虑 一 些 等 可 能 生日 的 极端 的 例子 。 如 每 个 人 都 在 1 月 1 日 出 
生 ， 那 么 需要 多 少 个 人 才能 满足 要 求 呢 ? 显然 两 个 人 就 够 了 。 再 举 一 个 没有 那么 
极端 的 例子 : 假设 每 个 人 都 在 1 月 出 生 ， 一 共 就 具有 31 天 而 非 一 年 中 的 365 天 ， 
那么 n 个 人 中 至 少 两 个 人 同一 天 生日 的 概率 就 变 成 了 : 


i _ 1 _30 .29 、.. (32-n) 
P( 有 人 在 同 天 生 月 ) =1=37 Xa 


一 一 代入 数字 ， 很 容易 就 可 以 得 出 当 n=7 时 概率 超过 了 0.5。 因 此 只 要 7 个 人 就 
可 以 了 ,显然 23 个 人 就 更 满足 要 求 了 。 这 些 都 是 特殊 的 生日 分 布 例子 ,不 论 你 
想 出 什么 其 他 的 例子 ， 所 需要 的 人 数 一 定 不 会 超过 23。 

数学 上 论证 : 为 了 将 问题 简化 ， 我 们 把 一 年 分 成 冬 半年 和 夏 半 年 ， 我 们 不 考 
虚 在 某 一 天 生日 ， 而 是 考虑 在 某 半 年 生日 。 假 设 现在 有 两 个 人 ， 他 们 在 冬 半年 或 
夏 半年 出 生 的 概率 是 相等 的 ， 即 1/2 (第 一 个 人 可 以 在 任何 一 个 半年 出 生 ， 第 二 
个 人 只 需要 与 第 一 个 人 在 同一 个 半年 ) 。 假 设 每 个 人 在 冬 半 年 出 生 的 概率 是 P， 
在 夏 半年 出 生 的 概率 就 是 1 -P， 两 者 互相 独立 。 那 么 两 个 人 都 是 在 冬 半年 出 生 的 
概率 就 是 p xp， 都 在 夏 半 年 出 生 的 概率 为 (1 -p) x (1 -p)。 因 此 两 人 在 同一 个 
半年 出 生 的 概率 为 p+ (1 -p)*。 当 p=1/2 时 概率 是 最 小 的 (你 可 以 随意 赋予 p 
一 个 值 然后 代入 ， 也 可 以 通过 计算 器 的 最 小 值 计 算 功 能 来 检验 ) 。 因 此 ， 两 个 人 
在 同一 个 半年 出 生 的 概率 最 小 为 1/2。 同 理 ， 不 论 现实 中 23 个 人 的 生日 如 何 分 
布 ， 我 们 可 以 计算 出 其 中 有 人 同一 天 生日 的 概率 至 少 也 为 1/2。 

生日 问题 可 以 从 各 个 角度 继续 延展 。 比 如 需要 多 少 个 人 才 可 以 保证 至 少 3 个 
人 在 同一 天 生日 的 概率 不 小 于 50% ? 大 概 是 82 个 人 。 需 要 多 少 个 人 才能 保证 至 
少 2 个 人 的 生日 相差 不 过 一 天 的 概率 不 小 于 50%? 只 需要 14 个 人 。 我 想 这 个 数 
字 不 会 让 你 觉得 不 可 思议 了 。 我 们 先 把 生日 问题 放 在 一 边 ， 讨 论 一 些 其 他 的 问 
题 。 在 后 面 博彩 一 章 里 我 们 又 会 回 到 这 个 问题 ， 然 后 教 你 如 何 用 它 来 挣 钱 。 是 
的 ， 确 确实 实 是 用 它 来 挣 钱 。 
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2.4 典型 的 非典 型 


存在 随机 性 的 情况 下 我 们 通常 会 用 “平均 ” “典型 ”这 样 的 词 来 形容 。 在 
1940 年 的 纽约 世界 博览 会 上 德 克 萨 斯 州 的 皮革 家 族 一 一 克拉 兰 敦 一 家 当选 为 
“典型 美国 家 庭 ”。“ 平 均 每 个 美国 人 ”有 八 千 美 金 的 卡 债 。 除 非 你 知道 它们 表示 
什么 样 的 意思 ， 每 一 句 话 都 有 可 能 引发 歧义 。 在 第 8 章 里 我 们 将 会 详细 了 人 解 平均 
数 ， 在 本 节 中 我 们 只 是 简单 地 接触 一 下 它们 ， 举 例 说明 被 认为 典型 的 事物 也 许 是 
不 可 能 发 生 的 。 

随机 选择 一 个 有 四 个 孩子 的 家 庭 。 最 可 能 有 多 少 个 女儿 ? 有 和 多少 个 儿子 ?最 
可 能 的 性 别 分 布 是 什么 所 有 孩子 都 是 同性 别 的 〈0 一 4) ， 或 是 一 个 孩子 与 其 他 
三 个 孩子 性 别 不 同 (1 一 3) ,或 是 两 个 孩子 性 别 相同 〈2 一 2)? 

上 述 问题 的 答案 似乎 是 2 个 女儿 、2 个 儿子 ， 性 别 分 布 为 2 一 2。 让 我 们 一 一 
来 检验 。 有 多 少 个 女儿 这 个 问题 可 以 用 二 项 式 分 布 来 解决 , 令 n=4, p =1/2， 
利用 1.9 节 中 的 公式 可 以 计算 出 有 0、1、2、3、4 个 女儿 的 概率 分 别 是 6. 25% ， 
25% ，47.5% ，25% 和 6. 25% 。 这 个 家 庭 最 有 可 能 有 两 个 女儿 ， 也 就 是 最 有 可 能 
有 两 个 儿子 。 而 最 后 的 问题 答案 自然 就 是 2 一 2 了 。 这 种 解法 对 吗 ? 当然 不 对 ， 
否则 的 话 我 也 没有 必要 写 这 一 节 了 。 最 有 可 能 出 现 的 性 别 分 布 是 1 一 3， 大 约 有 
50% 的 可 能 。 这 个 结果 很 容易 就 可 以 算出 ， 因 为 这 个 家 庭 有 一 个 儿子 三 个 女儿 的 
概率 是 25% ， 有 1 个 女儿 3 个 儿子 的 概率 也 25% ， 两 者 相 加 即 可 得 到 50% 。 但 
是 如 果 我 们 采取 如 下 表述 就 会 稍 显 奇怪 : 典型 的 四 口 之 家 里 有 2 个 女孩 ，2 个 男 
孩 ， 其 中 性 别 分 布 为 1 一 3! 问题 的 奇怪 之 处 就 在 于 “典型 家 庭 ” 这 个 概念 很 难 
界定 。 

在 牌 类 游戏 中 也 有 同样 的 问题 ， 它 会 让 你 更 为 吃惊 。 在 桥牌 中 ， 要 把 52 张 
牌 发 给 4 个 玩家 ， 每 人 13 张 牌 。 这 13 张 牌 最 有 可 能 以 什么 样 的 花色 分 布 呢 ? 你 
手 上 有 13 张 牌 ， 有 4 种 等 可 能 的 花色 ， 平 均一 下 每 种 花色 你 应 该 有 3. 25 张 牌 。 
四 售 五 人 到 最 近 的 整数 ， 你 各 种 花色 应 当 有 4 一 3 一 3 一 3 张 牌 。 从 某 种 意义 上 说 
这 应 当 是 “典型 ”的 分 布 。 但 这 是 最 可 能 出 现 的 吗 ? 不 是 的 ! 通过 计算 这 种 情 
况 和 其 他 可 能 出 现 的 情况 的 概率 可 知 ，4 一 4 一 3 一 2 这 种 情况 是 最 有 可 能 出 现 的 ， 
概率 为 22% ， 而 4 一 3 一 3 一 3 这 种 情况 的 概率 只 有 11% 。 事 实 上 有 一 些 其 他 的 分 
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布 情况 的 概率 也 比 4 一 3 一 3 一 3 这 种 情况 高 ， 见 表 2-2。 
表 2-2 桥牌 中 六 种 最 可 能 出 现 的 花色 分 布 




















花色 分 布 概率 
4 一 4 一 3 一 2 21. 6% 
5 一 3 一 3 一 2 15. 5% 
5 一 4 一 3 一 1 12. 9% 
5 一 4 一 2 一 2 10. 6% 
4 一 3 一 3 一 3 10. 5% 
6 一 3 一 2 一 2 5. 6% 





这 些 结果 看 似 违背 了 直觉 , 但 是 跟 上 面 性 别 分 布 的 例子 相 比 ， 我 们 必须 要 注 
意 到 我 们 其 实 没 有 区 分 “5 张 红 桃 ，3 张 梅 花 ，3 张 方块 与 2 张 黑 桃 ”的 情况 与 
“5 张 方块 ，3 张 红 桃 ，3 张 梅 花 与 2 张 黑 桃 ”"。 但 是 我 认为 这 种 区 别 相 比 于 数字 
大 小 来 说 在 桥牌 中 是 没有 意义 的 。 

你 也 许 会 对 计算 特定 花色 分 布 的 概率 感 兴趣 。 它 归根 结 底 是 组 合 问题 ， 以 
4 一 3 一 3 一 3 这 种 情况 为 例 来 计算 。 桥 牌 玩家 手 上 有 从 52 张 牌 中 随机 发 放 的 13 张 
牌 ,一 共 就 有 C3 种 牌 型 。 接 下 来 我 们 需要 找 出 所 有 符合 4 一 3 一 3 一 3 分 布 的 牌 
型 ， 数 量 不 少 哦 。 我 们 从 13 张 红 桃 牌 中 挑选 出 4 张 ， 一 共有 Cu 种 方法 。 而 从 其 
他 三 种 花色 牌 中 选 3 张 的 方法 各 为 Cu 种 。 乘 法 法 则 告诉 你 将 这 四 个 数字 相 乘 可 
以 得 到 4 一 3 一 3 一 3 情形 中 有 4 张 红 桃 的 所 有 情形 。 同 理 可 以 算出 有 4 张 梅 花 、4 
张 方块 或 4 张 黑 桃 的 数量 ， 最 终 我 们 可 以 得 出 
4xCt xCi, xC, xC, 

oa 
你 可 以 自己 练习 计算 4 一 4 一 3 一 2 分 布 情况 的 概率 ， 
C++x2xCn xCn xC xCh 
到 

可 能 性 最 小 的 是 13 一 0 一 0 一 0 的 分 布 情 况 ， 有 四 种 可 能 ; 接 下 来 就 是 12 一 1 一 0 一 0 
这 种 分 布 情况 ， 共 有 13 x13 x4 x3 = 2208 种 可 能 。 (读者 可 以 自行 解释 这 种 计算 
方法 。) 

让 我 们 再 用 飞镖 游戏 来 举例 。 飞 镖 盘 是 一 块 圆 形 的 板 ， 被 分 成 20 小 块 ( 扇 





P(4 一 3 一 3 一 3 分 布 情况 ) = 0.11 








P(4 一 4 一 3 一 2 分 布 情况 ) = 0. 22 
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形 图 ) ， 分 别 是 1 到 20 分 的 分 区 (不 是 按 顺 序 标的 )。 这 块 板 的 中 心 是 靶 心 ， 这 
块 板 有 两 个 同心 圆 ， 两 个 圆 中 间 有 0. 3 英寸 宽 。 两 个 圆圈 中 间 部 分 是 三 倍 分 区 ， 
投 中 这 个 区 域 就 获得 3 倍 的 得 分 ;外 面 的 区 域 是 双 倍 分 区 ， 投 中 此 部 分 获得 2 倍 
的 得 分 。 我 们 知道 这 么 多 就 够 了 ，。 

假设 现在 你 随意 投射 飞镖 .2 你 的 飞镖 插 满 了 镖 靶 ， 假 设 你 投 中 6 与 11 的 概 
率 完 全 是 相等 的 ， 投 中 双 倍 分 区 的 20 与 三 倍 分 区 的 3 也 是 等 可 能 的 。 显 然 , 平 
均 投 中 的 位 置 就 是 靶 心 ， 但 这 绝对 不 是 典型 的 情况 。 

关于 镖 靶 还 有 一 件 趣 事 。 每 一 个 位 置 都 能 用 与 水 平 轴 的 角度 和 圆心 〈 靶 心 ) 
的 距离 来 定位 ， 我 们 可 以 让 计算 机 来 随机 模拟 ， 从 0° 到 360° 之 间 随 机 选择 一 个 
角度 , 在 0 到 9 英寸 (通常 是 镖 靶 的 半径 ) 之 间 随 意 选择 一 个 半径 。 如 此 模拟 以 
后 我 们 会 发 现 飞镖 会 更 集中 在 靶 心 的 位 置 。 为 什么 呢 ? 

当 随 机 投 飞镖 时 ， 相 较 于 靶 心 更 容易 投 中 远 距 离 的 位 置 。 比 如 虽然 双 倍 分 区 
和 三 倍 分 区 同 宽 ， 但 因为 双 倍 分 区 比 三 倍 分 区 离 靶 心 更 远 ， 投 中 双 倍 分 区 会 比 三 
倍 分 区 容易 得 多 。 在 靶 心 周围 也 有 一 个 同样 的 宽度 圆圈 ， 这 个 区 域 就 更 难 投 中 。 
虽然 选中 位 置 离 靶 心 的 距离 是 随机 等 可 能 的 ， 但 是 这 并 不 意味 着 投 飞镖 投 中 也 是 
等 可 能 。 平 均 投 中 的 距离 并 不 是 位 于 半径 的 一 半 处 ， 而 是 半径 的 2/3 处。 数学 家 
们 如 何 计算 出 273 这 个 数字 我 不 打算 在 本 书 中 讨论 ， 反 正 我 们 用 实证 的 方法 也 已 
经 验证 了 (借助 于 计算 机 方便 多 了 ) 。 

当 你 在 地 球 表面 北纬 90" 和 南 纬 90" 之 间 ， 西 经 180" 和 东经 180° 之 间 随 意 选 
择 一 点 ， 同 样 的 问题 会 产生 。 如 果 你 重复 选择 ， 你 会 发 现 越 靠 近 极 点 你 选择 的 点 
会 越 集 中 ， 越 靠近 赤道 则 越 稀疏 。 这 是 因为 每 条 经 线 的 长 度 是 一 样 的 ， 但 是 纬 线 
却 长 短 不 一 。 事实 上 ， 南 北纬 90" 即 通常 称 的 两 级 都 只 是 一 个 点 ， 而 0° 纬 线 则 是 
整个 赤道 。 如 果 你 用 这 个 方法 随机 选择 你 的 度假 地 点 ， 那 你 很 有 可 能 要 去 斯 匹 次 
卑 尔 根 岛 度假 而 不 是 新 加 坡 的 莱 佛 士 酒店 了 。 

































































G@ ”毋庸 置疑 ， 专 业 的 选手 可 不 是 随意 投射 飞镖 的 。 法 庭 也 将 此 作为 事实 用 过 。1908 年 ， 一 个 英国 旅 
店 老板 吉姆 . 加 赛 德 被 控 允 许 客 人 赌 运气 ， 飞 镖 。 加 赛 德 让 当地 的 飞镖 冠军 “大 脚 ”威廉 . 安 纳 
金 作为 其 证 人 。 不 论 法 庭 说 什么 数字 ,“ 大 脚 ” 总 是 可 以 投 到 这 个 分 数 。 法 庭 意识 到 飞镖 游戏 是 
技术 而 非 运气 ， 加 赛 德 也 因此 被 无 罪 释 放 。 
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2.5 购物 策略 与 决斗 技巧 


人 生 的 很 多 选择 都 是 在 充满 不 确定 性 时 做 出 的 。 当 面 对 这 些 选 择 时 ， 你 需要 
用 到 手头 所 有 的 信息 来 做 最 明智 的 选择 。 不 论 是 娱乐 消 遗 还 是 现实 生活 ， 许 多 概 
率 问 题 都 与 如 何 选择 最 佳 概率 有 关 。 就 像 很 多 概率 问题 最 终 可 以 转化 成 为 扔 硬币 
或 挪 散 子 问题 一 样 ， 许 多 生活 问题 也 可 以 进行 类 似 的 转化 。 本 书 是 为 读者 提供 消 
遗 的 读物 ， 我 关注 的 重点 也 会 落 在 策略 和 决策 幽默 的 一 面 ， 但 是 读者 要 记 住 股 
市 、 战 场 和 婚姻 等 这 些 严肃 的 场合 有 时 也 会 被 戏称 为 游戏 和 谜 题 。 

亚马逊 在 线 商 店 有 一 个 功能 叫做 “人 金 盒子 ” 。 当 你 点 击 进去 的 时 候 ， 里 面 会 
有 十 种 不 同类 型 的 商品 ， 从 书籍 到 DVD ， 从 厨具 到 “松下 ER411NC 鼻 毛 和 耳 毛 
修剪 器 ”( 不 包括 电池 )。 每 一 次 都 只 会 出 现 一 种 产品 ， 当 你 决定 是 买 或 者 跳 过 
之 后 ， 才 会 出 现下 一 种 产品 。 以 前 当 你 决定 买 下 一 球 产 品 时 ， 剩 下 的 产品 就 不 会 
再 展示 了 ; 但 是 现在 你 可 以 随心 所 和 欲 选择 多 件 产 品 ， 只 是 你 依然 不 能 回 看 之 前 的 
产品 和 修改 订单 。 假 设 你 现在 不 多 不 少 只 需 买 一 件 产品 。 那 么 你 该 采取 什么 策略 
才能 将 赢 的 概率 最 大 化 ， 也 就 是 买 到 最 优惠 的 产品 呢 ? 

我 认为 “最 优惠 产品 ” 指 的 是 你 看 到 了 全 部 的 十 件 优 惠 产 品 ， 然 后 按 优 惠 
的 程度 从 高 到 低 排列 ， 然 后 买 最 优惠 的 产品 。 但 是 现在 的 问题 就 在 于 你 每 次 只 能 
看 到 一 个 ， 而 且 要 立刻 决定 是 买 还 是 路 过 。 我 们 该 怎么 办 呢 ? 假设 你 采用 的 是 缺 
乏 耐 心 的 策略 一 一 总 是 买 第 一 件 产 品 。 所 有 的 产品 都 是 随机 排列 ， 你 有 10% 的 
机 会 选 到 最 优惠 的 产品 。 假 设 你 采取 的 是 犹 瑰 不 决 的 策略 ， 每 次 都 看 完 所 有 十 个 
产品 ， 然 后 只 能 选择 最 后 一 个 产品 ， 这 时 你 依然 有 10% 的 机 会 选 到 最 优惠 的 产 
品 。 假 设 你 采取 的 是 随机 的 策略 ， 随 意 在 第 一 个 产品 和 第 十 个 产品 中 挑 一 个 产 
品 ， 然 后 买 下 。 这 时 你 选 购 最 优惠 产品 的 概率 依然 是 10% 。 那 么 有 更 好 的 方 
法 吗 ? 

当然 有 。 首 移 看 完 前 五 个 产品 ， 从 中 选择 一 个 最 优惠 的 产品 ， 将 它 称 为 目标 
产品 。 然 后 继续 看 接 下 来 的 产品 ， 如 果 发 现 有 一 个 产品 比 这 个 目标 产品 还 要 优 
惠 ， 那 么 就 严 下 它 。 如 果 剩 下 的 五 个 产品 没有 一 个 比 目 标 产 品 还 要 优惠 ， 那 说 明 
目标 产品 就 是 最 优惠 的 产品 ， 但 你 却 错过 了 它 不 得 不 买 最 后 一 个 产品 。 如 果 你 采 
取 这 种 购物 策略 的 话 你 赢 的 概率 就 是 25%。 因 为 如 果 次 优惠 产品 在 前 五 个 产品 
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中 ， 最 优惠 产品 在 后 五 个 产品 中 你 就 能 保证 成 功 。 次 优惠 产品 在 前 五 个 产品 中 的 
概率 是 5/10 =1/2 〈 因 为 最 优惠 产品 在 任何 位 置 出 现 都 是 等 可 能 的 ) 。 在 这 个 前 
提 之 下 ， 最 优惠 产品 在 后 五 件 产 品 中 的 概率 是 5/9 ( 剩 下 的 9 个 位 置 中 出 现 最 优 
惠 产 品 都 是 等 可 能 的 ) 。 两 个 事件 同时 发 生 的 概率 需要 利用 乘法 原则 计算 条 件 概 
率 ， 即 P( 第 二 优惠 产品 在 前 五 个 产品 中 ,最 优惠 产品 在 后 五 个 产品 中 ) =1/2 x 
5/9 =5/18 =0. 28 这 个 数字 显然 要 比 0.25 大 。 事 实 上 赢 的 概率 会 比 上 述 计 算出 
来 的 更 大 ， 因 为 这 并 不 包含 你 所 有 能 启 的 方式 。 比 如 说 ， 当 最 优惠 选择 是 第 六 件 
产品 ， 而 第 二 优惠 产品 在 第 七 件 至 第 十 件 产品 之 间 ， 在 这 种 情况 你 也 会 启 。 还 存 
在 其 他 赢 的 情形 。 当 然 最 优惠 的 产品 必须 在 后 五 件 产品 之 中 ， 而 且 不 会 被 之 后 将 
会 出 现 的 产品 超过 ， 你 才 会 赢 。 你 可 以 通过 列 出 所 有 赢 的 情形 来 计算 这 个 概率 ， 
但 是 这 也 太 无 聊 了 。 你 可 以 设 定 一 个 小 一 点 的 数字 ， 比 如 说 四 种 产品 ， 然 后 再 列 
出 来 所 有 赢 的 情形 。 当 有 四 种 产品 时 一 共有 41 = 24 种 排列 产品 的 方式 ， 你 可 以 
数 出 来 所 有 赢 的 情形 。 你 可 以 用 跳 过 “前 面 一 半 ” 的 策略 (比如 ,从 1 到 4 的 
产品 中 ，1 号 产品 是 最 优惠 的 产品 ， 在 4231 、3412 等 类 似 情 形 下 都 会 赢 ) 。 你 会 
得 出 说 的 概率 是 10/24。 

假设 现在 不 止 有 十 件 产 品 可 以 选择 ， 而 是 有 一 百 件 产品 可 供 选 择 。 你 还 是 用 
这 种 策略 : 先 找 出 前 五 十 种 产品 中 最 优惠 的 产品 ， 然 后 再 看 接 下 去 的 产品 ， 当 有 
产品 比 这 个 目标 产品 更 优惠 时 就 选择 这 个 产品 。 当 目标 产品 是 次 优惠 产品 ， 而 最 
优惠 产品 是 在 后 五 十 种 产品 之 中 的 情况 ， 这 种 情况 下 你 一 定 会 赢 。 此 时 赢 的 概率 
是 50/100 x50/99 =25/99， 比 1/4 (等 于 25/100) 要 大 一 些 。 在 其 他 情况 下 你 
可 能 也 会 赢 ， 但 是 赢 的 概率 会 低 于 25% 。 这 让 你 意识 到 不 论 一 共有 多 少 种 产品 
供 选 择 ， 你 选 到 最 优惠 产品 的 概率 会 维持 在 一 个 水 平 不 变 。 即 使 有 一 百 万 种 选 
择 ， 你 可 以 在 前 五 十 万 种 产品 中 选择 一 个 最 优惠 的 目标 产品 ， 然 后 再 依次 看 后 
五 十 万 种 产品 ， 当 出 现 比 目标 产品 更 优惠 的 产品 时 买 下 它 。 这 时 你 赢 的 概率 依 
然 是 低 于 25% 的 。 看 起 来 机 会 挺 大 了 ， 但 这 依然 不 是 你 可 以 做 出 的 最 佳 选择 。 

有 一 个 更 好 的 策略 : 在 前 37% 产 品 中 选择 最 优惠 的 产品 ， 再 接 下 来 的 产品 
中 有 比 这 个 产品 更 优惠 的 就 买 下 来 。 那 么 此 时 你 赢 的 概率 是 37%。 这 个 策略 是 
最 优 策略 ， 其 他 策略 再 复杂 也 不 可 能 让 你 赢 的 概率 更 高 。 当 可 供 选 择 的 产品 越 多 
就 越 接 近 37% 。 在 “人 金 盒子 ”问题 中 ，10 的 37% 是 3.7， 所 以 你 得 到 的 结 


是 4。 
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这 个 问题 是 概率 学 中 的 经 典 问 题 ， 它 常常 出 现在 公主 如 何在 一 群 求 婚 者 中 挑 
出 最 优秀 的 人 ， 或 是 王子 如 何 挑选 出 嫁妆 最 丰厚 的 新 娘 。 我 决定 将 这 个 概率 问题 
从 童话 世界 中 搬 进 现实 的 网 购 中 ， 然 后 举 了 一 个 我 亲身 经 历 的 情形 。 顺 便 提 一 
句 ， 我 没有 买 描 毛 和 耳 毛 修剪 带 。 

现在 让 我 们 暂时 逃离 凡尘 俗世 ， 进 入 导演 赛 尔 乔 ， 莱 翁 内 的 意大利 西部 片 。 
在 1996 年 经 典 电影 《黄金 三 镖 客 》( 译 者 注 : 也 被 译 为 《 善 恶 丑 》) 中 的 最 后 一 
幕 ， 三 个 主人 公布 兰 迪 、“ 天 使 之 眼 ” 和 图 科 ， 手持 枪 杆 站 在 墓地 中 ， 随 时 准备 
射击 。 让 我 们 稍稍 改变 一 下 剧本 ， 假 设 布 兰 迪 总 是 会 射 中 目标 , “天 使 之 眼 ”每 
次 射 中 目标 的 概率 是 90% ， 而 图 科 则 是 50%。 从 图 科 开 始 ， 依 次 射击 下 一 个 人 
( 除非 他 自己 已 经 被 击 中 了 ) 。 那 么 图 科 幸 存 的 最 优 策 略 是 什么 呢 ? 

首先 ， 如 果 选 择 先 杀 死 “天 使 之 眼 ” 的 话 图 科 肯 定 会 死 。 这 绝对 不 行 。 而 
先 成 功 杀 死 布 兰 迪 的 话 ， 图 科 还 有 机 会 在 天 使 之 眼 的 枪 下 逃命 。 而 如 果 他 射 杀 布 
兰 迪 不 成 功 ， 布 兰 迪 接着 射 死 “天 使 之 眼 ”(“ 天 使 之 眼 ” 比 图 科 的 枪法 更 好 )， 
图 科 此 时 就 还 有 最 后 的 一 次 机 会 来 杀 布 兰 迪 。 不管 瞄准 了 谁 ， 如 果 图 科 的 第 一 枪 
没有 射 中 的 话 对 他 更 有 利 。 所 以 结论 就 是 第 一 枪 图 科 应 该 故意 不 瞄准 射 中 。 这 样 
的 话 ， 剩 下 的 两 个 人 之 中 有 一 个 人 就 会 结束 另 一 个 人 的 生命 ， 图 科 此 时 就 有 开 最 
后 一 枪 的 权利 从 而 幸存 下 来 。 那 么 他 应 当 有 瞄准 谁 呢 ? 

如 果 他 瞒 准 的 是 布 兰 迪 ， 那 么 接 下 来 发 生 的 事情 应 当 如 下 : 布 兰 迪 杀 死 了 
“天 使 之 眼 ”， 图 科 得 到 最 后 射 杀 布 兰 迪 的 机 会 ,他 有 50% 活 下 来 的 概率 。 更 好 
的 策略 就 是 瞄准 “天 使 之 眼 ”， 然 后 打 偏 了 。 如 果 天 使 之 眼 在 射 杀 布 兰 迪 时 也 没 
命中 ， 概 率 为 10% ,场景 又 会 切换 到 最 初 由 图 科 射 击 的 情形 ， 此 时 图 科 有 50% 
的 可 能 活 下 来 。 如 果 “ 天 使 之 眼 ” 杀 死 了 布 兰 迪 ， 图 科 要 与 “天 使 之 腿 ” 进 行 
最 后 的 决胜 一 击 。 这 样 我 们 就 可 以 计算 出 由 图 科 开 第 一 枪 ， 且 他 最 终 说 的 概 
率 了 。 

为 了 让 问题 更 简单 ， 让 我 们 假设 子弹 的 供应 是 无 限量 的 (我 们 讨论 的 可 是 克 
林 特 : 伊 斯 特 伍德 的 电影 ) 。 那 图 科 要 怎样 才能 赢 呢 ? 他 的 第 一 枪 可 以 射 中 。 他 
同样 也 可 以 射 偏 第 一 枪 ,“ 天 使 之 眼 ”也 射 侦 ， 然 后 图 科 第 二 次 射 中 了 ,依次 类 
推 。 就 像 我 们 在 1.7 节 中 介绍 的 安娜 在 不 至 于 丧命 的 网 球 游 戏 中 获胜 概率 的 计算 
方法 一 样 ， 图 科 也 有 无 数 种 启 的 情况 。 就 像 网 球 问 题 一 样 ， 我 们 可 以 用 一 个 将 图 
科 顾 的 概率 设 定 为 一 个 未 知 数 然后 用 公式 计算 。 有 两 种 情况 要 考虑 : 
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1) 图 科 第 一 枪 就 射 中 了 。 

2) 图 科 和 “天 使 之 眼 ” 第 一 枪 都 打 偏 了 。 
显然 我 们 不 用 考虑 图 科 射 偏 ， 天 使 之 眼 射 中 这 种 情况 。)) 那么 图 科 赢 的 概率 是 
P( 图 科 赢 ) = P( 图 科 以 第 一 种 情形 赢 ) x P( 发生 第 一 种 情况 ) + P( 图 科 以 第 二 种 
情形 赢 ) x P( 发生 第 二 种 情况 ) 
其 中 P( 图 科 以 第 一 种 情形 赢 ) =1，P( 发 生 第 一 种 情况 ) =0.5，P( 发 生 第 二 种 情 
况 ) =0.5 x0.1=0.05。 在 第 二 种 情况 下 ， 第 一 轮 射击 完成 之 后 ， 两 个 未 知 数 P 
(图 科 最 ) 等 于 已 (图 科 以 第 二 种 情形 顾 ) 。 用 PP 来 表示 这 个 未 知 数 ， 可 以 得 出 公式 

p=0.5+0.05 xp 

计算 得 出 P=0.5/0. 95=0. 53 。 提 醒 读 者 注意 这 个 概率 是 “天 使 之 眼 ”成 功 射 杀 
布 兰 迪 的 前 提 之 下 的 ， 而 这 个 前 提 发 生 的 概率 是 0.9。 如 果 “ 天 使 之 眼 ” 没 有 射 
杀 成 功 布 兰 迪 ， 概 率 为 0.1， 这 就 给 了 图 科 0.5 的 胜率 。 综 合 考虑 所 有 的 情况 ， 
用 加 法 法 则 计算 


P( 图 科 顾 ) =0.9 x 








PP 











0.5 
0.95 


图 科 假 装 瞄准 “天 使 之 眼 ” 然 后 射 偏 ， 用 这 个 小 伎俩 赢 的 概率 是 52% 。 弗 
雷 德里 克 … 葛 斯 特 勒 在 他 1965 年 的 著作 《概率 的 50 大 难题 》 (Fifty challenging 
Problems in Probability) 中 也 提 到 相似 的 问题 ， 对 于 这 种 不 道德 的 决斗 行为 作者 
感到 担 优 。 在 解决 图 科 问 题 时 ， 我 们 排除 了 道德 因素 的 考量 。 


+0.1x0.3=0.32 

















2.6 细胞 分 裂 问题 与 分 支 过 程 


现在 还 有 另外 一 个 问题 ， 我 们 也 可 以 用 上 文中 解决 图 科 问 题 采 取 的 策略 来 解 
决 。 假 设 有 一 种 细胞 ， 分 裂 和 死亡 的 概率 相同 。 如 果 一 个 种 群 从 这 样 一 个 细胞 开 
始 变化 ， 那 么 这 个 种 群 最 终 灭绝 的 概率 是 多 少 呢 ? 

这 个 问题 并 不 简单 吧 。 如 果 第 一 个 细胞 分 裂 失 败 ， 种 群 就 直接 灭绝 ， 概 率 即 
为 1/2。 如 果 第 一 个 细胞 分 裂 成 功 ， 就 有 了 两 个 细胞 。 但 若 它 们 都 分 裂 失 败 ， 这 
个 种 群 仍 可 能 在 第 二 代 就 灭绝 ,概率 是 1/2 x1/2 =1/4。 也 有 可 能 两 个 细胞 都 分 
裂 成 功 或 者 一 个 成 功 一 个 失败 。 这 个 问题 越 往 后 发 展 就 会 迅速 变 得 复杂 ， 需 要 用 
计算 机 进行 计算 。 如 果 开 始 的 时 候 成 功 分 裂 ， 那 么 最 终 就 会 有 许多 细胞 。 有 了 很 
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多 细胞 后 ， 我 们 通常 预计 一 半分 裂 一 半死 亡 ,， 那么 下 一 代 的 细胞 数量 也 大 致 相 
同 ， 那 么 种 群 则 趋向 保持 不 变 。 但 是 ， 这 只 是 通常 的 情况 。 实 际 种 群 大 小 当然 存 
在 大 量 随机 波动 ， 很 难 预 计 会 发 生 什么 情况 。 这 时 我 们 可 以 用 到 全 概率 公式 来 轻 
巧 地 解决 问题 。 

假设 为 种 群 灭 绝 事 件 ，5 为 第 一 个 细胞 成 功 分裂 事 件 ，F 为 其 分 裂 失 败 事 
件 ， 总 概率 的 计算 公式 如 下 : 

P(E) =P(E|S) xP(S) +P(E|F) xP(F) 
其 中 三 个 概率 事件 都 很 简单 ，P(S) =P(F) =1/2,P(E|F) =1， 因 为 知 第 一 个 
细胞 分 裂 失 败 ， 种 群 则 直接 灭绝 。 需 要 计算 的 是 P(E |S)， 即 若 第 一 个 细胞 成 功 
分 裂 情 况 下 种 群 灭 绝 的 概率 。 但 这 意味 着 我 们 又 回 到 了 两 个 细胞 的 问题 ， 因 为 子 
细胞 又 开始 新 的 一 轮 再 繁殖 (或 世系 ) 。 必 须 两 个 亚 种 群 都 灭绝 ， 整 个 种 群 才 算 
灭绝 。 我 们 又 把 问题 带 回 了 原点 ， 不 同 的 只 是 现在 初始 的 不 是 一 个 细胞 而 是 两 
个 。 假设 p = P(E) ， 即 最 终 灭绝 的 概率 。 同 时 假定 两 个 亚 种 群 互相 独立 发 展 ， 那 
么 两 者 同时 灭绝 的 概率 为 p xp =p*。 所 以 P(E) =p,P(E|S) =p*， 代入 公式 即 为 
p=p x1/2+1x1/2 

这 就 是 一 个 简单 的 一 元 二 次 方程 ,通常 你 可 能 知道 如 何 解 ， 如 果 你 会 的 话 ， 
你 就 会 算出 结果 p =1。 灭 绝 是 必然 的 ! 如 果 你 并 不 熟悉 一 元 二 次 方程 的 运算 ， 你 
也 可 以 将 p=1 代入 验证 是 否 正确 (虽然 一 元 二 次 方程 通常 有 两 个 解 ， 但 这 个 方 
程 仅 有 一 个 解 ) 。 这 完全 出 乎 意料 。 尽 管 种 群 通常 保持 不 变 ， 但 随机 波动 迟早 将 
导致 灭绝 。 

细胞 种 群 的 分 支 过 程 仅仅 是 一 个 简单 的 小 例子 。 首 先 人 研究 分 支 过 程 的 是 法 国人 比 
安 内 梅 (LJ. Bienaymé) 和 英国 人 弗朗西斯 . 高 尔 顿 一 士 (Sir Francis Galton ) ， 享 
利 . 沃 森 (Henry Watson) 。 弗 朗 西 斯 ， 高 尔 顿 盘 士 生 于 1822 年 ， 鞭 于 1911 年 ， 
他 是 一 位 有 趣 的 人 。 他 属于 有 产 阶 级 〈 换 名 话说 ， 这 类 人 不 工作 也 可 以 生活 ) ， 
他 将 一 生 都 奉献 给 业余 科学 家 生涯 。 他 研究 气象 学 、 基 因 学 、 心 理学 、 地 理学 、 
热带 探险 和 统计 学 。 最 为 著名 的 贡献 可 能 是 指纹 的 应 用 ， 这 一 贡献 比 他 自己 本 身 
要 出 名 得 多 ， 但 高 尔 顿 事 士 却 远 不 如 他 的 表 兄 达尔 文 出 名 。 高 尔 顿 事 士 沉迷 于 数 
据 收 集 和 分 类 学 (尤其 是 对 人 的 分 类 )。 他 的 口袋 里 时 常 揣 着 卡片 ， 通 过 在 卡片 
刺 孔 来 记录 在 大 街 上 看 到 的 女神 和 了 丑 女 的 数量 。 这 一 结果 最 终 形 成 了 英国 的 “ 美 
人 地 图 ”， 这 也 是 其 他 任何 旅行 指南 所 没有 的 。 他 还 调查 过 “祈祷 的 效力 ”， 并 
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且 丈 量 父 子 们 的 身高 、 体 重 和 其 他 特质 ， 由 此 引进 了 概率 学 上 的 “回归 和 相关 分 
析 ”， 这 些 我 都 会 稍 后 在 书 中 解释 。 高 尔 顿 鲫 士 众多 的 科学 贡献 中 ， 优 生 学 是 最 
值得 怀疑 的 ， 即 通过 选择 性 繁殖 使 人 种 更 加 “优越 ?2 。 尽 管 他 反对 20 世纪 后 期 
一 些 意识 流 学 者 提出 的 优生 学 观点 ， 这 也 许 是 他 的 这 项 贡献 没有 像 其 他 贡献 一 样 
受 欢 迎 的 原因 。 

作为 一 位 典型 的 英国 绅士 ， 高 尔 顿 本 士 担心 英国 的 贵族 血统 会 消失 ， 他 将 这 
个 问题 当做 一 个 概率 问题 发 表 在 了 一 本 科学 期 刊 上 。 高 尔 顿 的 问题 跟 之 前 说 的 细 
胞 问题 是 同一 类 问题 ,不同 之 处 在 于 人 类 可 以 生育 多 个 后 代 ， 这 使 得 问题 变 得 更 
复杂 。 高 尔 顿 自己 也 没有 解决 这 个 问题 ， 他 的 朋友 享 利 . 沃 森 (一 位 值得 尊重 的 
数学 家 、 登 山 运 动员 ) 解决 了 这 个 问题 。 沃 森 利 用 一 种 数学 方法 来 解决 这 个 问 
题 ， 这 个 方法 至 今 依然 被 学 习 分 支 过 程 理论 的 概率 学 家 们 使 用 着 ,我 也 是 其 中 之 
一 。 我 大 部 分 的 概率 研究 都 集中 在 这 个 领域 ， 主 要 应 用 于 细胞 和 分 子 生 物 学 。 我 
还 人 研究 了 基因 突变 的 累积 和 细胞 持续 分 裂 时 染色 体 不 断 变 短 的 问题 的 相关 模型 。 
我 与 这 位 英国 贵族 靠 得 最 近 的 一 次 是 我 在 2001 年 发 表 的 一 篇 关于 曼彻斯特 人 们 
寿命 问题 的 文章 。 

让 我 们 拿 出 那 副 旧 的 扑克 牌 。 你 按照 我 的 要 求 进行 如 下 的 游戏 ， 我 把 牌 洗 好 
并 开始 一 张 一 张 地 把 牌 翻 到 正面 。 在 任何 时 间 你 都 可 以 说 “ 停 ， 下 一 张 是 红 
色 ”。 如 果 你 是 正确 的 ， 你 就 赢 了 。 你 必须 在 某 个 时 间 点 上 说 出 来 ， 如 果 我 翻 完 
51 张 牌 你 还 没有 叫 停 的 话 ， 你 就 必须 猜 最 后 一 张 牌 是 红色 的 。 除 此 之 外 ， 你 可 
以 自由 运用 任何 策略 。 什 么 是 最 好 的 策略 ? 你 赢 的 概率 是 多 少 呢 ? 

如 果 你 在 我 开始 发 牌 前 认为 第 一 张 牌 是 红色 的 ， 那 你 有 一 半 的 概率 会 赢 。 你 
能 有 更 高 的 概率 赢 吗 ? 如 果 你 让 我 发 第 一 张 牌 并 且 它 是 黑色 的 ， 这 时 你 叫 停 那么 
下 一 张 牌 是 红色 的 概率 是 26/51， 大 约 是 51% 。 也 有 可 能 第 一 张 牌 是 红色 ， 这 时 
你 就 处 于 不 利 的 地 位 ， 不 应 继续 猜 下 一 张 牌 是 红色 而 是 过 掉 更 多 的 牌 。 这 样 策略 
的 原理 还 不 太 清楚 ， 但 似乎 过 掉 的 牌 中 红色 的 比 黑 色 的 少 更 加 有 利 。 或 许 只 要 我 
已 经 翻 开 的 牌 中 黑 牌 比 红牌 多 ， 你 就 叫 停 ， 如 果 这 种 情形 一 直 不 发 生 ， 那 就 直到 
最 后 一 张 牌 ? 



























































名 亚历山大 ' 格雷 毛 姆 :贝尔 就 是 优生 学 的 支持 者 。 他 通过 研究 玛 荡 葡萄 周 岛 上 的 邦人 群体 ， 得 出 耳 伏 是 
多 遗传 的 ， 并 且 主 张 要 通过 法 律 禁止 厦 人 通婚 。 他 本 身 并 不 歧视 瑚 人 ， 他 的 母亲 和 妻子 都 是 侮 人 。 
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在 我 给 出 正确 答案 之 前 ， 先 让 我 们 只 用 简化 版 的 两 张 红 牌 〈(R) 和 两 张 黑 牌 

(B) 来 测试 一 下 这 个 策略 。 总 共 会 出 现 以 下 六 种 组 合 : 

BBRR, BRBR, BRRB, RBRB, RBBR, RRBB 

于 是 问题 就 变 成 在 这 些 组 合 中 你 赢 的 概率 。 在 第 一 种 情况 下 ， 你 会 输 是 因为 你 会 
在 翻 开 第 一 张 牌 后 就 猜 下 一 张 是 红色 的 ， 而 第 二 张 却 是 黑色 的 。 在 第 二 和 第 三 种 
情形 下 你 会 启 。 在 第 四 种 情形 下 则 会 输 〈 必 须 直 到 取出 最 后 一 张 牌 ) ， 在 第 五 种 
情形 下 启 ， 在 第 六 种 情形 下 输 (必须 直到 取出 最 后 一 张 牌 ) 。 六 种 情况 中 三 种 会 
赢 ， 即 赢 的 概率 是 50% ， 没 比 猜 第 一 张 牌 说 的 概率 有 所 提高 。 试 试 另 外 一 种 策 
略 : 在 翻 开 的 牌 中 有 两 张 是 黑色 的 之 后 猜 下 一 张 是 红色 的 牌 。 利 用 这 个 策略 ， 你 
会 在 第 一 、 第 二 和 第 五 种 情形 下 局 ， 在 其 他 的 情形 下 ， 你 必须 等 到 最 后 一 张 才 
猜 ， 而 最 后 一 张 却 是 黑 牌 。 这 又 是 一 半 启 一 半 输 的 问题 。 现 在 试 试 一 种 看 上 去 思 
春 的 策略 : 当 更 多 的 红牌 被 翻 开 之 后 猜 下 一 张 牌 是 红色 的 。 这 肯定 会 更 粳 糕 吗 ? 
但 是 看 看 结果 发 现 你 会 在 被 迫 直 到 最 后 一 张 牌 的 第 一 、 二 种 情形 下 赢 ， 并 且 当 你 
在 第 六 种 情形 下 猜 第 二 张 牌 是 红色 的 也 会 说 。 因 此 这 个 貌似 轧 春 的 策略 也 有 一 半 
的 概率 会 说 。 事 实 上 ， 选 择 任何 策略 说 的 概率 都 是 50% 。 

对 于 一 副 完整 的 牌 来 说 ， 任 何 策略 说 的 概率 都 是 一 半 。 任 何 一 个 “理性 的 策 
略 ” 只 有 在 决定 性 条 件 发 生 时 才 会 显示 出 优势 ， 但 是 这 种 优势 常常 会 因为 决定 性 
条 件 不 发 生 而 不 起 作用 。 而 那些 “思春 的 策略 ” 既 有 优点 也 有 缺点 ， 顾 的 概率 
也 是 一 半 。 上 文 简易 版 的 扑克 有 牌 问题 很 好 地 解释 了 这 一 点 ， 但 这 也 许 不 足以 让 你 
相信 在 一 整 副 扑克 牌 中 也 会 发 生 同 样 的 情况 。 一 个 经 常 提出 的 论据 就 是 与 其 猪 下 
一 张 是 红色 不 如 猜 最 后 一 张 是 红色 。 因 为 不 管 你 采用 哪 一 种 策略 ， 在 实际 运用 中 
下 一 张 牌 是 红色 与 最 后 一 张 牌 是 红色 (也 许 下 一 张 牌 就 是 最 后 一 张 牌 ) 的 概率 
是 相同 的 。 而 最 后 一 张 牌 在 洗 牌 的 时 候 就 已 经 确定 了 ， 它 是 黑色 或 是 红色 都 是 等 
可 能 的 。 有 一 些 人 认同 了 这 个 论据 ， 但 我 也 遇 到 过 不 同意 这 个 论据 的 人 。 当 然 我 
可 以 用 严密 的 数学 方法 来 证 明 ， 但 在 此 处 我 就 不 袭 述 了 。 

再 举 一 个 关于 猜测 的 策略 的 例子 。 我 两 只 手中 各 有 一 张 纸 条 ， 我 在 每 张 纸 条 
上 都 写 了 一 个 数字 ， 你 选择 一 只 手 看 这 张 纸 条 上 的 数字 ， 然 后 猜测 另 一 只 手中 纸 
条 上 的 数字 是 比 它 小 还 是 比 它 大 。 这 两 个 数字 都 是 整数 (不论 正 负 ) ， 且 不 相 
等 ， 除 此 之 外 你 对 于 我 如 何 选 择 、 选 择 了 什么 数字 等 信息 一 无 所 知 。 此 时 你 还 有 
一 半 的 机 会 能 赢 吗 ? 
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看 起 来 不 可 能 。 但 是 奇迹 发 生 了 ， 你 可 以 的 ! 首先 ， 你 选择 一 个 整数 ， 不 论 
正 负 ， 然 后 加 上 0.5， 将 其 当做 临界 值 。 你 可 以 随机 选择 一 个 整数 ， 当 选择 无 限 
多 时 就 需要 计算 机 来 运算 了 。 当 你 确定 好 临界 值 之 后 ， 你 随机 选择 我 某 一 只 手 看 
到 了 这 个 数字 ， 然 后 假设 你 选择 的 临界 值 是 这 个 看 到 的 数字 和 剩 下 那个 数字 中 间 
的 数字 。 基 于 该 假设 ， 你 可 以 做 出 选择 了 (事实 上 ， 你 用 这 个 临界 值 来 代替 了 隐 
藏 起 来 的 数字 ) 。 如 果 你 看 到 的 数 比 临界 值 要 小 ， 那 么 你 就 知道 这 个 数 是 两 个 数 
中 小 一 点 的 数 。 如 果 你 看 到 的 数 比 临界 值 要 大 ， 你 会 猜 这 个 数 是 两 个 数 中 大 一 点 
的 数 ( 因为 你 在 选 定 的 整数 上 加 上 了 0.5， 这 就 保证 临界 值 不 会 与 看 到 的 数 一 样 
大 ) 。 使 用 这 样 的 策略 ， 你 获胜 的 概率 将 会 大 于 50% 。 想 想 这 是 为 什么 呢 ? 
我 们 需要 考虑 三 种 情况 : 
1) 临界 值 比 两 个 数字 都 要 大 。 
2) 临界 值 比 两 个 数字 都 要 小 。 
3) 临界 值 位 于 两 个 数字 之 间 。 
在 前 两 种 情况 中 ， 你 假设 临界 值 位 于 两 个 数 之 间 的 前 提 是 错误 的 ， 所 以 唯一 
影响 的 就 是 你 随机 选中 的 那个 手 里 写 着 的 数字 ， 此 时 你 有 50% 的 概率 猜 对 。 
具体 说 来 ， 在 第 一 种 情况 中 如 果 你 选中 的 是 小 数字 你 就 猜 对 了 ; 在 第 二 种 情况 
下 ， 选 了 大 数字 就 赢 了 。 任 何 一 种 情况 下 你 赢 的 机 会 都 是 一 半 对 一 半 。 在 第 三 种 
情况 下 ， 因 为 假设 的 前 提 是 对 的 ， 所 以 你 肯定 能 猿 对 。 将 这 三 种 情况 合 起 来 ， 不 
论 前 提 是 对 的 概率 为 多 少 ， 你 赢 的 概率 都 要 超过 50%。 让 我 们 更 加 严谨 地 人 处理 
这 个 问题 。 假 设 G 事件 为 你 的 猜测 正确 ，4 事件 为 假设 前 提 是 正确 的 , p 为 4 事 
件 发 生 的 概率 。 那 么 利用 全 概率 法 则 可 以 得 出 猜测 正确 的 概率 为 
P(G)=P(G|A) xp+P(G| 非 4) x (1-p) 
=1 xp+1/2x(1-p)=(1+p)/2 
结果 显然 比 1/2 要 大 。 可 以 用 计算 机 或 者 具有 随机 数 生 成 功能 的 计算 器 来 验证 这 
一 结果 。 随 机 数 的 值 要 在 0 ~1 之 间 ， 所 以 如 果 你 将 所 有 的 数字 都 限定 在 这 个 范 
围 之 内 ， 你 也 可 以 自己 来 检验 。 假 设 一 开始 设 定 的 数 是 0.3 和 0.7， 让 计算 机 在 
0 ~1 之 间 随 机 选择 一 个 临界 值 。 最 后 在 0.3 ~ 0.7 之 间 随 机 选择 一 个 数 ， 将 上 述 
猜测 的 策略 运用 到 此 处 。 反 复 重 复 这 个 过 程 ， 统 计 你 赢 的 次 数 。 现 在 假设 p 是 数 
字 随 机 分 布 在 0.3 ~0.7 之 间 的 概率 。 而 0.3 ~0.7 之 间 的 数字 占 0 ~ 1 之 间 数 字 
的 40% ， 所 以 P=0.4， 因 此 你 猜测 正确 的 概率 为 (1 +0.4)/2 =0.7。 写 一 个 计 
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算 机 的 程序 来 验证 这 个 问题 并 不 困难 ， 真 正 困难 的 地 方 在 于 如 何 去 理 解 这 个 结 
论 。 你 通过 一 个 不 论 正确 与 否 、 相 关 与 否 的 猜测 提高 了 说 的 概率 。 除 此 之 外 我 也 
不 知道 应 当 如 何 更 有 理 有 据 地 解释 了 。 也 许 是 时 候 问 问 玛 丽 莲 了 ? 

把 最 后 两 个 问题 放 在 一 块 讨 论 非 常 有 趣 。 在 前 一 个 问题 中 〈 猜 下 一 张 牌 是 不 
是 红色 ) ， 看 起 来 你 猜 对 的 概率 肯定 超过 一 半 ， 但 结果 却 不 是 。 而 第 二 个 问题 中 
( 猜 哪 一 个 数字 更 大 ) ， 似 乎 猜 对 的 概率 低 于 一 半 ， 但 结果 却 证 明 猜 对 的 可 能 性 
大 于 一 半 。 不 好 意思 ， 我 又 要 哆 叶 地 再 说 一 遍 “ 这 难道 不 酷 吗 ?” 








2.7 结语 


在 这 一 章 中 我 们 通过 众多 例子 认识 到 我 们 估算 概率 的 能 力 有 多 差 。 这 也 许 是 
因为 我 们 都 被 训练 得 不 自觉 去 寻找 秩序 和 规律 ， 从 而 忽视 和 误解 了 许多 概率 现 
象 。 或 者 是 我 们 做 的 概率 训练 还 不 够 多 ? 不 论 什 么 原因 ， 我 们 都 在 概率 法 则 的 指 
导 之 下 仔细 考虑 问题 ， 正 确 运 用 公式 最 终 解 决 了 问题 。 在 这 一 章 中 我 们 并 没有 接 
触 到 什么 特别 的 问题 ， 下 一 章 中 我 们 会 研究 一 种 特殊 类 型 的 概率 问题 : 永 不 消失 
的 微小 概率 。 
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微乎其微 的 概率 : 
为 什么 奇迹 总 会 发 生 

















在 这 一 章 里 我 们 将 讨论 : 
1 你 每 吸 一 口气 中 究竟 吸入 了 多 少 个 凯撒 大 帝 临 终 前 呼出 的 最 后 一 口气 的 
型 所 分子 
2. 数字 37 又 隐藏 着 怎样 的 秘密 呢 ? 
3. 你 中 乐 透 大 奖 是 一 个 奇迹 么 ? 
这 章 中 介绍 了 小 概率 ， 我 们 切忌 忽略 它们 ， 因 为 一 个 事件 即使 再 稀有 也 不 意 
味 着 它 永远 不 会 发 生 。 
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3.1 可 能 的 不 可 能 


在 第 2 章 中 我 们 介绍 的 概率 问题 乍 看 起 来 都 违背 直觉 ， 出 乎 意料 。 这 一 章 我 
们 会 继续 接触 一 些 特殊 的 概率 问题 : 为 什么 不 可 能 发 生 的 事情 还 是 常常 会 发 生 
呢 ? 为 什么 在 概率 那么 小 的 情况 下 还 总 是 有 人 会 中 彩票 又 总 是 有 人 遭 雷 臂 呢 ? 在 
生日 问题 上 我 们 其 实 已 经 接触 过 此 类 现象 。 通 过 2. 3 节 的 介绍 我 们 几乎 可 以 肯定 
100 个 人 中 至 少 有 2 个 人 的 生日 是 同一 天 (这 一 事件 的 概率 高 达 0. 9999997 ) 。 如 
果 我 们 只 考虑 单独 的 两 个 人 的 话 ， 他 们 同一 天 生日 的 概率 为 1/365 (第 一 个 人 可 
以 随意 在 哪 一 天 出 生 ， 第 二 个 人 必须 与 第 一 个 人 在 同一 天 出 生 )， 大 约 只 
0.3% 。 然 而 在 100 个 人 中 , 我 们 共有 Ci =4950 个 生日 对 ， 在 这 之 中 要 找 出 生 
日 在 同一 天 的 一 对 非常 容易 。 

生日 问题 的 例子 说 明了 一 个 道理 ， 尽 管 有 些 事情 从 个 体 看 来 几乎 是 不 可 能 发 
生 的 ,但 当 它 以 群体 出 现时 ， 因 为 有 许多 的 个 体 事件 在 尝试 着 ， 所 以 发 生 的 概率 
就 很 高 了 。 男 一 个 例子 就 是 风靡 全 国 的 博彩 游戏 “ 选 3”。 你 从 0 ~ 9 十 个 数字 中 
选 出 三 个 数字 ， 按 照 选 择 的 顺序 排列 组 成 一 个 数 ; 换 句 话说 也 就 是 从 000 ~ 999 
这 一 千 个 数字 中 选择 一 个 数字 。 当 你 选择 了 三 个 数字 之 后 ， 你 中 奖 的 概率 是 
1/1000， 所 以 如 果 你 只 玩 一 次 那么 你 中 奖 的 概率 很 低 。 在 有 些 州 ， 如 德 克 萨 斯 州 
“ 选 3” 游 戏 每 天 开奖 2 次 ， 每 周 有 6 天 开奖 。 这 样 如 果 你 每 一 次 都 投注 ， 你 一 
年 有 624 次 机 会 能 中 奖 。 这 就 意味 着 如 果 你 一 直 投 注 的 话 ， 你 每 两 年 至 少 会 中 一 
次 奖 ， 不 可 能 不 中 奖 的 。 如 果 你 在 某 一 期 中 奖 了 ， 那 么 这 一 期 你 中 奖 的 概率 依然 
还 是 1/1000。 

让 我 们 将 它 转 化 为 数学 问题 吧 。 假 设 重复 进行 某 种 试验 ， 每 次 成 功 的 概率 为 
p， 且 每 次 试验 都 相互 独立 。 如 果 你 做 了 nn 次 试验 ， 那么 至 少 一 次 成 功 的 概率 为 

P( 至 少 一 次 成 功 ) =1-(1-p) 
其 中 ,1 -p 表示 每 次 试验 不 成 功 的 概率 ，(1 -p)" 表示 n 次 都 不 成 功 的 概率 。 运 
用 概率 第 一 法 则 ， 用 1 减 去 n 次 都 不 成 功 的 概率 得 出 的 就 是 至 少 一 次 成 功 的 概 
率 。 这 个 公式 也 是 本 节 内 容 的 基础 。 现 在 假设 一 年 内 每 一 期 “ 选 3” 游 戏 你 都 下 
注 了 。 那 么 此 时 p =0.001, n=624， 则 
P( 至 少 一 次 中 奖 ) =1- (1 -0.001) 呈 一 0.46 
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你 在 这 一 年 内 有 一 半 的 机 会 中 奖 。 没 有 中 奖 的 期 数 都 会 被 忘 了 ， 你 靠 千 分 之 一 的 
概率 终于 实现 中 奖 的 梦想 了 。 

在 近期 的 《危险 边缘 》 节 目 中 , 场 上 三 位 选手 中 有 两 位 选手 相隔 20 年 先后 
在 同一 所 高 中 上 学 。 主 持 人 阿 力克 斯 特 里 伯 克 觉 得 没什么 比 这 个 还 要 不 可 思议 
的 了 。 如 果 我 们 依然 只 考虑 个 体 事件 发 生 的 概率 p， 那 么 概率 就 非常 的 小 了 。 然 
后 阿 力克 斯 已 经 主持 了 20 年 的 《危险 边缘 》, 的 数值 非常 的 大 。 而 且 念 同一 所 
高 中 是 指 一 种 巧合 ， 也 可 能 有 选手 在 同一 所 大 学 上 学 ， 住 在 同一 个 街区 ， 去 看 过 
同一 场 美国 橄榄 球 超级 杯 大 赛 等 。 只 不 过 阿 力 克 斯 之 前 没有 注意 过 。 我 也 只 是 对 
阿 力 克 斯 的 话 进行 了 分 析 ， 事 实 上 我 和 大 家 一 样 觉 得 这 个 巧合 太 妙 了 。 

还 有 一 些 极端 的 例子 ，20 世纪 80 年 代 中 期 伊 甘 琳 . 亚当 斯 在 4 个 月 内 连续 
中 了 两 次 新 泽 西 州 乐 透 大 奖 ， 奖 金 总 额 高 达 540 万 美金 。 报 纸 报道 说 这 样 的 事件 
发 生 的 概率 是 17 万 亿 分 之 一 〈 后 面 跟着 12 个 零 ) 。 这 是 什么 事件 的 概率 呢 ? 它 
们 有 什么 关联 呢 ? 17 万 亿 分 之 一 是 亚当 斯 女士 每 次 只 买 一 张 彩票 ， 且 中 了 两 次 
大 奖 的 概率 。 如 果 我 们 计算 的 是 某 人 在 四 个 月 的 时 间 内 中 了 两 次 各 州 的 乐 透 奖 ， 
概率 就 要 大 很 多 了 。 普 杜 大 学 的 两 位 教授 乔治 . 麦 凯 布 和 斯 蒂 芬 . 塞 缪 尔 斯 花 了 
很 长 时 间 计 算出 了 这 个 概率 ， 大 约 是 1/30， 不 再 小 得 那么 离谱 了 。 而 不 限制 在 
四 个 月 内 ， 有 人 中 两 次 州 乐 透 奖 的 概率 就 更 大 了 。 就 像 瑞典 机 场 经 理 例 子 中 介绍 
的 那样 ， 我 们 在 这 里 计算 的 概率 是 “再 一 次 中 奖 ” 而 不 是 “第 二 次 中 奖 ”。 买 乐 
透 彩 票 的 人 会 一 直 买 下 去 ， 中 了 奖 之 后 就 会 投入 更 多 的 钱 去 买 彩票 。 (亚当 斯 女 
士 的 确 也 是 这 么 干 的 有些 人 再 中 一 次 奖 不 是 不 可 能 ， 但 是 我 们 要 计算 的 是 : 
有 人 中 了 两 次 奖 。9 

英国 物理 学 家 人 詹姆斯. 杰 恩 斯 项 士 ， 在 他 1940 年 出 版 的 著作 《气体 分 子 运 
动 论 简介 》 (An Introduction to the Kinetic Theory of Gases) 一 书 中 写 到 了 一 个 有 趣 
的 例子 ， 说 明 某 些 看 起 来 极端 不 可 能 发 生 的 事件 其 实 很 有 可 能 会 发 生 。“ 你 每 吸 
一 口气 时 ， 究 竟 吸 入 了 多 少 个 凯撒 大 帝 公元 前 44 年 临 死 前 呼出 最 后 一 口气 的 气 






























































































































































G@ 即使 莫 林 ' 威 尔 科 特 斯 猜 中 了 两 次 大 奖 的 数字 ， 但 她 并 没有 赚 一 分 钱 。1980 年 6 月 ， 她 买 了 马 萨 
诸 塞 州 和 罗 德 岛 的 彩票 ， 她 买 的 数字 与 这 两 个 地 方 的 大 奖 数字 一 样 ， 但 是 却 没有 赚 一 分 钱 : 她 买 
的 马萨诸塞 州 的 乐 透 号 码 是 罗 德 岛 乐 透 的 大 奖 号 码 ， 而 她 买 的 罗 德 岛 乐 透 号 码 却 是 马萨诸塞 州 乐 
透 大 奖 号 码 。 
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体 分 子 ?” 他 举 这 个 例子 是 为 了 说 明 气 体 动力 学 中 包含 的 大 量 分 子 。 

如 果 有 吸 进去 任何 一 个 分 子 的 话 ， 似 乎 这 个 概率 应 当 是 0。 让 我 们 来 算 一 算 
吧 。 往 姆 斯 画 士 告诉 我 们 空气 中 大 约 有 104 个 分 子 ， 人 们 呼吸 会 使 用 到 102 个 分 
子 。 两 千年 过 去 了 ， 我 们 假设 凯撒 在 最 后 说 的 那 句 “还 有 你 吗 ， 布 鲁 图 ?” 时 呼 
出 的 气体 已 经 在 大 气 中 传播 并 与 其 他 的 分 子 充 分 混合 。 现 在 考虑 你 刚 吸 进 去 的 一 
个 气体 分 子 ， 它 是 凯撒 呼出 的 概率 有 多 大 ? (你 可 以 现在 也 吸 一 口气 。) 这 是 一 个 
经 典 的 概率 问题 。 用 凯撒 呼出 的 分 子 数量 除 以 空气 中 总 的 分 子 数量 ， 因 此 你 吸 进 这 
个 特殊 的 分 子 的 概率 是 10”/10” =10-”， 这 种 概率 类 似 于 连续 抛 硬币 73 次 正面 
都 朝 上 。 但 是 你 并 不 是 只 有 一 次 机 会 , 事实 上 你 有 10” 次 机 会 ， 所 以 n=10”， 
p=10-?， 利 用 上 述 公式 计算 出 : 

P( 至 少 吸 进 一 个 凯 撤 呼出 的 气体 分 子 ) =1 - (1 -10-?)'* ~0.63 

这 个 概率 居然 超过 了 一 半 。 那 小 得 可 怜 的 概率 p 被 大 得 惊人 的 n 次 方 平衡 了 ， 你 
最 终 能 成 功 吸 进 凯撒 呼出 的 分 子 的 概率 才 会 比 你 不 能 吸 进 的 概率 要 大 。 有 一 个 小 
小 的 提醒 ， 如 果 你 想 用 便携 式 计算 器 来 计算 上 面 的 公式 ， 你 可 能 得 到 的 结果 是 0 
而 不 是 0. 63 。 因 为 此 时 计算 器 先 计算 的 是 括号 里 面 的 数 ， 得 出 它 的 近似 值 是 1。 
等 会 我 就 会 教 给 读者 另外 一 种 计算 的 方法 。 

细心 的 读者 也 许 会 说 在 这 种 情况 下 分 子 间 并 不 是 独立 的 ， 而 之 前 的 例子 中 连 
续 扔 硬币 是 独立 的 。 事 实 的 确 如 此 ， 假 设 你 一 个 一 个 地 吸 进 气体 分 子 ， 前 一 个 成 
功 吸 进 了 凯撒 呼出 的 分 子 ， 那 么 下 一 次 也 成 功 的 概率 就 会 变化 ， 因 为 凯撒 呼出 来 
的 分 子 数 量 和 总 的 分 子 数 量 都 必须 减 去 1。 相 比 于 硬币 问题 ， 这 个 问题 其 实 跟 之 
前 的 至 少 有 一 个 红 桃 扑克 牌 问题 更 像 。( 从 有 102 张 红 桃 的 104 张 牌 中 抽出 102 张 
牌 。) 这 个 问题 我 们 需要 用 到 组 合 的 知识 。 但 是 因为 1 相对 于 之 前 的 数 来 说 实在 
太 小 了 ， 所 以 我 们 可 以 假设 每 一 次 吸 进 一 个 分 子 的 事件 是 独立 的 ， 这 样 也 方便 
计算 。 

你 也 许 还 会 想 是 不 是 凯撒 呼出 的 所 有 空气 分 子 还 在 空气 中 呢 。 毕 竟 氧 气 会 被 
人 类 和 动物 的 血液 吸收 ， 二 氧化 碳 会 被 植物 吸收 ， 这 些 分 子 可 能 很 早已 经 就 不 在 
空气 中 了 。 为 了 更 严谨 ,我 们 就 只 考虑 氮气 吧 ， 空 气 中 有 78% 的 氮气 而 且 它 不 
会 消失 。 那 么 我 们 之 前 计算 用 的 p 必须 要 乘 以 0. 78 ， 得 出 的 概率 下 降 到 了 54% ， 
这 依然 高 于 一 半 。 

当然 科学 问题 的 很 多 假设 都 难以 被 验证 。 毕 竟 我 们 上 面 提 到 的 例子 都 只 是 为 
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了 说 明 一 些 观 点 以 供 大 家 娱乐 。 饥 撤 呼 出 的 最 后 一 口气 的 分 子 最 终 去 了 哪里 一 点 
也 不 重要 。 约翰. 艾 伦 :保罗 斯 于 1993 年 在 《美国 数学 月 刊 》 上 发 表 了 一 篇 文 
章 《 数 学 盲 )>， 并 在 其 中 描述 了 这 个 凯撒 问题 ,我 想 他 一 定 没有 料 到 会 遭 到 如 此 
尖锐 的 抒 击 。 一 位 伦 兹 先生 花 了 两 页 半 纸 的 篇 幅 来 批评 保罗 斯 的 假设 和 计算 , 认 
为 他 在 竭尽 全 力 哗众取宠 。 难 道 数学 家 们 就 不 能 好 好 相处 吗 ? 





























1987 年 ， 我 在 澳大利亚 东海 岸 游 了 一 会 儿 泳 ;海浪 把 我 的 眼镜 冲 走 了 。 
1992 年 ， 我 遇见 了 来 自 布 里 斯 班 的 澳大利亚 统计 学 家 罗 德 尼 ' 沃 尔 夫 。 他 的 故 
乡 离 我 当年 游泳 的 地 方 很 近 。 我 们 一 开始 讨论 袋鼠 、ACZDC 乐队 、 咸 味 桨 三 明 
治 这 些 司空 见 惯 的 东西 ， 然 后 我 就 提 到 了 我 丢失 的 眼镜 。 沃 尔 夫 并 没有 捡 到 我 的 
眼镜 。 

好 吧 ， 这 是 一 个 很 烂 的 故事 ， 我 也 几乎 不 会 跟 别人 说 这 个 故事 。 但 是 如 果 他 
有 一 次 去 游泳 的 时 候 捡 到 了 我 的 眼镜 呢 ? 这 也 太 巧 了 ， 我 一 定 会 反 反 复 复 说 这 个 
故事 的 。 我 举 这 个 例子 就 是 为 了 说 明 你 每 昕 到 一 个 巧合 的 背后 有 无 数 个 平淡 无 奇 
的 故事 。 不 大 可 能 发 生 的 事情 随时 都 有 可 能 发 生 ， 很 有 可 能 发 生 的 事情 发 生 的 概 
率 比 它 高 多 了 。 

拿 梦 境 的 预言 来 说 吧 ， 当 你 梦 到 在 匹兹堡 的 简 阿 姨 时 她 恰好 打 电 话 把 你 叫 
醒 。 即 使 她 固定 每 周 给 你 打 一 次 电话 ， 每 个 月 也 会 出 现在 你 的 梦 中 几 次 ,这 两 件 
事情 同时 发 生 的 概率 就 非常 难 计算 。 想 一 想 所 有 人 当 他 梦 见 亲戚 时 ， 这 个 亲戚 都 
会 打 电 话 来 把 他 叫 醒 这 件 事 。 也 许 对 于 某 些 地 方 ， 某 些 人 来 说 常常 会 发 生 。 但 是 
当 它 发 生 在 你 身上 时 你 会 觉得 不 可 思议 。 

有 一 次 在 希腊 的 帕 特 摩 斯 岛 遇 到 了 一 个 老 朋 友 ， 我 觉得 特别 的 开心 。 但 如 果 
考虑 到 每 年 夏天 大 批 大 批 的 瑞典 人 都 会 去 希腊 度假 ， 这 也 没什么 让 人 吃惊 的 了 。 
很 多 人 都 会 偶遇 男 一 些 人 。 只 不 过 现在 这 件 事情 发 生 在 了 我 的 身上 ， 然 后 我 就 把 
这 个 故事 告诉 了 你 们 。 有 一 次 在 悉尼 的 街头 我 遇 到 了 以 前 的 高 中 同学 。 我 也 觉得 
非常 的 奇妙 ， 但 是 他 却 见 怪 不 怪 的 。 他 说 我 是 近 几 个 月 他 遇 到 的 第 20 个 老乡 了 。 

个 体 事件 发 生 的 概率 很 小 ,但 是 次 方 之 后 群体 事件 概率 很 大 ， 如 恒 河 沙 
数 。 它 们 包括 了 中 乐 透 奖 到 被 内 电 辟 中， 从 基因 突变 、 物 种 进化 到 其 他 星球 上 的 
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生命 。 数 学 家 、 科 普 作 家 艾 米 尔 ' 艾 克 赛 尔 在 他 的 作品 《头号 概率 : 为 什么 宇宙 
中 注定 会 有 智慧 生命 》(Probability 1: Why There Must Be Intelligent Life in the 
Universe) 中 就 提 到 了 我 们 举 的 最 后 一 个 例子 。 这 个 问题 的 概率 当然 没有 办 法 计 
算出 来 ， 你 可 能 也 不 赞同 他 在 书 中 作出 的 假设 , 但 问题 的 关键 在 于 一 个 特别 小 的 
概率 p 并 不 代表 这 个 事件 不 会 发 生 。 在 宇宙 管 慧 生命 这 个 例子 中 ， 宇 宙 中 有 数 十 
亿 个 银河 系 ， 每 个 银河 系 中 又 有 数 十 亿 颗 恒星 ， 我 们 无 法 探测 出 这 个 n 有 和 多大。 

宇宙 的 问题 对 我 来 说 太 深 奥 了 ， 所 以 还 是 让 我 来 说 我 旅行 中 遇 到 的 故事 吧 。 
我 在 大 学 期 间 有 一 次 跟 朋 友 一 块 去 南 太平 洋 旅 行 。 在 萨摩 亚 首 都 阿 皮 亚 机 场 时 我 
们 听 到 身后 两 个 人 在 用 瑞典 语 交 谈 。 结 果 发 现 那 两 人 是 住 在 我 家 几 个 街区 之 外 的 
朋友 。 我 们 结伴 在 萨摩 亚 玩 了 一 周 ， 然 后 就 分 开 了 。 四 个 月 之 后 我 们 又 在 悉尼 机 
场 见 面 了 ， 而 且 我 们 还 是 同一 趟 航班 ! 我 不 知道 这 是 可 能 性 大 还 是 可 能 性 小 ,但 
是 我 觉得 这 大 有 趣 了 。 

当 语 言 学 家 们 在 研究 不 同 语言 间 的 联系 时 ， 他 们 通常 会 讨论 一 些 古 老 语言 中 
出 现 的 单词 ， 比 如 数字 、 家 庭 关 系 和 身体 部 位 。 有 时 候 的 确 会 出 现 一 些 相 似 之 
处 。 比 如 现代 和 希腊 语 中 “眼睛 ”的 单词 是 “mati”(uar) ， 而 萨摩 亚 语 则 是 
“mata”。 这 看 起 来 至 少 一 种 不 可 能 发 生 的 巧合 ， 但 是 曾经 有 一 位 语言 学 家 就 认为 
这 两 种 语言 之 间 是 存在 联系 的 >。 尽 管 古 希腊 语 和 加 利 福 尼 亚 的 印第安 丘 马 什 人 
的 语言 都 有 一 个 叫 simi 地 方 (希腊 的 那个 岛屿 名 叫 ipm， 岛 上 有 一 个 盛产 葡萄 
酒 的 simi 庄园 ) ， 但 从 没有 人 说 过 这 两 种 语言 之 间 存 在 联系 。 在 室 无 关系 的 两 种 
语言 里 发 现 相 似 的 单词 并 不 是 那么 不 可 思议 。 因 为 两 个 字 节 的 单词 实在 是 有 限 ， 
世界 上 那么 多 种 语言 都 需要 用 到 这 些 单词 ， 最 终 必 人 然 会 有 相似 的 。 让 我 最 后 再 用 
一 个 例子 来 结束 这 趟 波 西 尼 亚 语 课程 吧 。 萨 摩 亚 语 中 数字 4 是 “fa”， 读 音 与 第 
四 个 音节 相似 (do-re-mi-fa)， 你 可 以 捏造 一 下 这 个 单词 与 你 母语 之 间 的 联系 。 
最 后 也 是 我 最 爱 的 一 个 语言 学 上 的 巧合 : 波 托 马克 河 是 由 美国 本 土 人 民 自 己 命 名 
的 ， 而 希腊 语 中 “potomaki” (TorakdaXv) 就 表示 小 河 。 这 概率 是 该 多 小 呀 ? 

马丁 普 利 默 与 布莱尔 . 金 合 著 的 《 超 乎 巧合 》 (Beyond Coincidence) 一 书 
中 就 搜集 了 很 多 这 些 日 常生 活 中 发 生 的 不 可 思议 的 巧合 (包括 伊美 琳 . 亚当 斯 和 















































外 ”人们 还 发 现 了 有 一 个 希腊 的 小 岛 也 叫做 萨摩 斯 。( 这 是 古代 数学 巨匠 毕 达 哥 拉 斯 的 故乡 。) 
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之 前 章节 提 过 的 可 怜 的 莫 林 . 威 尔 科 特 斯 的 故事 ) 。 这 本 书 并 不 是 一 本 数学 类 的 
书 ， 所 以 他 们 并 没有 在 书 中 提 到 很 多 概率 问题 ， 但 书 中 的 一 些 例 子 却 可 以 用 我 们 
学 习 过 的 方法 来 计算 事件 的 概率 。 比 如 书 中 提 到 了 2002 年 9 月 11 日 纽约 州 “ 选 
3” 的 中 奖 数字 是 …… 是 的 ， 就 是 911。 这 是 冥 冥 之 中 天 注定 还 是 仅仅 只 是 一 个 
普通 的 概率 问题 ? 不 管 怎么 样 ， 这 都 足够 让 人 觉得 不 可 思议 。 普 利 默 和 金 在 书 中 
告诉 读者 相隔 了 200 多 年 以 后 吉米 . 享 德里 克 斯 住 在 乔治 . 弗 莱 德 列 . 韩 德 尔 伦 
敦 故 址 的 隔壁 。 不 知道 这 两 个 作者 还 有 没有 新 的 发 现 ， 我 也 很 好 奇 。 

“现金 3” 这 个 博彩 游戏 在 美国 的 一 些 州 也 很 盛行 。 你 从 某 一 个 区 间 的 数字 
(每 个 州 的 范围 不 一 样 ) ， 比 如 1 ~40， 选 出 5 个 数字 。 你 是 选 “1-2-3-4-5” 还 是 
“3-11-14-26-39” 呢 ?大 部 分 人 更 倾向 于 后 者 。 前 一 组 连续 的 数字 看 起 来 就 不 可 
能 ? 这 种 情况 也 从 来 没有 中 奖 过 。 第 二 组 数字 没有 遵循 任何 规律 ， 与 我 们 随机 选 
出 的 数字 如 “5-8-19-24-33” 相 比 没有 任何 差别 。“3-11-14-26-39” 这 组 数字 其 
实 代 表 的 就 是 一 组 没有 任何 规律 的 数字 ， 在 我 们 眼 里 这 组 数字 要 比 第 一 组 连续 的 数 
字 更 容易 中 奖 。 如 果 中 奖 的 数字 是 连续 五 个 数字 那么 我 们 一 定 会 觉得 非常 的 “ 神 
奇 "。 也 有 一 些 其 他 很 特殊 序列 的 数字 ， 如 “1-3-5-7-9”、“2-4-6-8-10”。 但 是 一 般 
的 数字 序列 实在 太 多 了 ， 所 以 我 们 才 会 觉得 出 现 这 些 特殊 的 序列 的 数字 会 比 出 现 
一 般 的 数字 序列 的 概率 小 得 多 。 

扔 硬币 也 是 同样 的 情况 。 如 果 你 连续 扔 十 次 硬币 ，HHHHHHHHHH 与 
HHTHTTTHHT 其 实 是 等 可 能 出 现 的 ， 概率 都 为 (1/2)"。 但 是 由 于 第 一 种 情况 
实在 太 特 殊 了 ， 所 以 我 们 想当然 地 就 会 认为 第 二 种 随机 五 次 正面 朝 上 五 次 反面 朝 
上 的 普通 情况 (概率 大 约 是 0.25) 更 加 容易 发 生 。 但 其 实 按照 这 种 情形 设 定 的 
顺序 扔 硬币 的 概率 都 是 (1/2)"”， 与 第 一 种 十 次 正面 都 朝 上 根本 没有 区 别 。 

似乎 人 类 都 有 一 种 寻找 模式 、 规 律 和 巧合 的 天 性 ， 这 种 天 性 往往 会 让 我 们 误 
人 歧途 。 密 文 和 阴谋 都 是 通过 数字 和 字母 的 组 合 来 传递 信息 。2005 年 秋天 的 确 
风 下 散 活动 中 ， 我 的 妻子 和 我 在 德 克 萨 斯 州 的 厄 尔 巴 索 待 过 一 段 时 间 (我 们 觉得 
世界 末日 的 到 来 一 定 会 伴随 着 飓风 ) 。 有 一 天 我 坐 在 一 家 名 叫 “ 阿 尔 多 维 诺 穿越 
沙漠 之 行 ”的 豪华 餐馆 露台 边 上 读 着 彼得 . 伯 恩 斯 坦 的 《与 天 为 敌 》。 这 本 书 从 
风险 管理 的 角度 记叙 了 概率 和 统计 的 恢宏 历史 。 我 在 西 德 克 萨 斯 州 冬日 的 暖 阳 之 
下 喝 着 罗斯 威 尔 外 星人 琥珀 啤酒 ， 突 然 我 意识 到 “ 伯 思 斯坦” 在 德语 中 是 
“琥珀 ”的 意思 。 太 可 怕 了 1! 我 如 今 还 在 琢磨 这 些 罗 斯 威 尔 外 星人 究竟 想 要 告诉 
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我 什么 。 

另外 一 个 典型 的 巧合 就 是 共同 认识 的 熟人 。 我 想 这 在 每 个 人 身上 都 发 生 过 。 
你 在 飞机 上 跟 旁 边 的 人 闲聊 ， 发 现 他 的 表姐 是 你 妹妹 的 发 型 师 ， 或 者 一 些 奇怪 的 
关系 。 我 又 一 次 在 汤加 遇 到 了 一 个 瑞典 男孩 ， 他 也 叫 彼得 。 并 且 他 小 时 候 也 在 我 
的 家 乡 生活 过 ， 我 们 还 有 一 个 共同 的 儿 时 玩 伴 : 马 格 纳 斯 。 这 些 例 子 都 再 一 次 证 明 
了 小 世界 效应 : 两 个 陌生 人 可 以 通过 几 个 人 的 联系 而 认识 。 心 理学 家 斯 坦 利 ， 米尔 
格拉 姆 早 在 1967 年 就 进行 了 这 项 开创 性 的 试验 。 他 写 信 给 美国 中 西部 的 一 群 
志愿 者 们 ， 让 他 们 通过 各 种 关系 找到 一 个 住 在 马萨诸塞 州 的 人 。 这 些 志愿 者 只 
能 把 信 寄 给 一 个 自己 认识 的 人 ， 然 后 让 这 个 人 把 信 传 递 给 下 一 个 人 。 如 此 以 往 
直到 这 个 马萨诸塞 州 的 人 收 到 这 封 信 。 这 些 人 就 必须 绞 尽 脑 计 地 通过 给 出 的 名 
字 、 地 点 和 职业 想 想 他 们 的 朋友 谁 最 可 能 认识 这 个 人 。 只 有 15% 的 信 最 终 到 
达 了 这 个 目标 个 体 手 中 。 这 些 成 功 到 达 的 信函 最 多 经 过 11 次 中 转 , 平均 只 需 
要 8 次 。 米 尔格 拉 姆 和 其 他 人 之 后 通过 一 般 的 邮件 和 电子 邮件 等 途径 还 几 次 进 
行 这 个 实验 ， 通 常 只 需要 6 次 就 可 以 完成 了 。 你 可 能 也 听 过 “六 度 分 隔 理论 ” 
这 个 术语 ， 有 时 也 被 称 为 小 世界 效应 ， 也 就 是 说 任何 一 个 人 想 认识 男 外 一 个 陌 
生 人 只 需要 经 过 六 个 人 介绍 。 这 看 起 来 是 荒 廖 的 。6 这 个 结论 的 得 出 没有 任何 
科学 依据 ， 但 是 这 个 理论 的 关键 在 于 大 多 数 人 都 可 以 通过 很 短 的 链条 就 相互 认 
识 了 。 

在 这 个 社会 分 工 越 来 越 细 的 时 代 ， 分隔 的 度 可 以 更 准确 地 计算 出 来 。 在 2.2 
节 的 脚注 中 我 提 到 了 数学 家 保罗 . 厄 多 斯 。 厄 多 斯 是 一 位 多 产 的 数学 家 ， 他 在 科 
学 杂志 上 发 表 过 1500 篇 文章 ， 其 中 大 约 有 500 篇 是 与 他 人 合 著 的 。 于 是 产生 了 
一 个 新 的 概念 “ 厄 多 斯 数字 ”; 一 位 数学 家 通过 研究 出 版 物 需 要 多 少 步 可 以 与 厄 
多 斯 建立 联系 。 对 厄 多 斯 自己 来 说 这 个 数字 就 是 0; 对 跟 他 合 著 的 这 些 作者 来 说 
数字 是 1; 对 这 些 与 厄 多 斯 合 著 的 作者 再 合 著 的 作家 们 来 说 数字 是 2; 依次 类 推 。 
大 部 分 数学 家 都 有 一 个 这 样 的 “ 厄 多 斯 数字 ”,， 平均 下 来 这 个 数字 是 4.7。 厄 多 
斯 之 所 以 有 这 么 多 合 著 是 因为 他 个 人 奇怪 的 生活 方式 。 他 居 无 定 所 ， 常 常 带 着 一 
两 件 行李 在 外 漂泊 ， 周 游 世 界 。 他 会 将 合 著 的 数学 研究 给 其 他 数学 家 充当 房 费 、 
车 费 甚至 是 一 杯 咖啡 的 钱 。 

我 的 厄 多 斯 数字 是 4。2001 年 的 时 候 我 与 著名 的 遗传 统计 学 家 诺 纳 吉 . 查 克 
拉 波 提 (Ranajit Chakraborty) 写 过 一 篇 关于 如 何 将 分 支 处 理 运用 到 一 位 马萨诸塞 
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州 百 岁 老人 资料 库 的 文章 。 而 他 又 曾经 与 印度 统计 学 家 拉 奥 (C. R. Rao) (在 统 
计 学 界 非常 著名 的 人 物 ) 合 著 过 文章 。 而 拉 奥 又 曾经 与 一 个 天 文 统计 学 家 乔 
吉 * 巴 杜 〈 是 的 ， 就 是 天 文 统计 学 !) 合 著 过 。 乔 吝 ' 巴 杜 又 与 尼 多 斯 一 起 发 表 
过 文章 。 厄 多 斯 数字 为 4 一 点 也 不 稀奇 ,大概 有 四 万 个 人 的 厄 多 斯 数字 是 3 甚至 
是 更 小 。MathSciNet 这 个 在 线 的 数学 出 版 物 数据 库 的 一 个 有 趣 的 功能 就 是 让 你 知 
道 任何 数学 家 的 厄 多 斯 数字 。 

而 在 美国 电影 界 ， 厄 多 斯 数字 就 变 成 了 凯 文 . 贝 肯 数字 。 假 定 两 个 演员 在 同 
一 部 电影 中 出 现 就 说 明 他 们 之 间 是 存在 联系 的 。 因 为 一 部 电影 里 的 演员 远 比 一 篇 
数学 文章 的 合 著作 者 要 多 ， 所 以 贝 肯 数字 的 平均 数 比 厄 多 斯 数字 平均 数 还 要 小 ， 
只 有 2. 95 。 芝 加 哥 概 率 学 家 帕特里克 ' 布 林 斯 力 的 厄 多 斯 数字 是 4， 但 是 他 同时 
也 拥有 贝 肯 数字 ， 因 此 他 可 是 能 同时 拥有 两 种 数字 的 人 的 小 型 俱乐部 里 的 一 员 。 
布 林 斯 力 在 电影 《不 可 触犯 》 中 出 演 过 一 个 角色 ， 这 让 他 的 贝 肯 数字 为 2。( 这 
部 电影 的 男 一 位 演员 罗伯特 : 德 尼 罗 跟 凯 文 ， 贝 肯 共 同 出 演 过 《豪情 四 兄弟 》。) 
根据 弗吉尼亚 网 站 上 “ 贝 肯 的 神 论 ”， 其 实 好 莱 坞 至 少 有 一 千 个 演员 比 贝 肯 更 适 
合成 为 “好 莱 坞 中 心 ”"， 比 如 蜜 雪 儿 … 菲 佛 (“* 蜜 雪 儿 “' 菲 佛 数字 ”的 平均 数 是 
2. 88) ， 伐 安 . 基 顿 (2. 82) ， 克 林 特 . 伊 斯 特 伍德 (2. 80) 。 这 些 名 演员 们 之 间 
的 联系 都 很 紧密 ， 我 想 六 度 分 隔 理论 最 容易 让 人 记 住 的 表述 应 当 是 “六 度 贝 肯 理 
论 ”。 虽 然 贝 肯 是 一 位 不 错 的 演员 ,但 是 他 还 是 远 比 不 上 厄 多 斯 。 大 概 加 上 人 詹 姆 
斯 . 迪 恩 、 约 翰 ， 韦 恩 和 马龙 白兰 度 才 能 企及 厄 多 斯 的 才智 、 创 造 力 和 古怪 。 
那么 你 的 耶 达 姆 数字 是 多 少 呢 ? 如 果 握 过 手 就 表示 两 人 之 间 有 联系 ， 那 么 我 
的 数字 是 4。 关 键 的 中 间 人 就 是 前 国务 卿 詹姆斯 - 贝克 ， 他 曾经 在 我 工作 过 的 莱 
斯 大 学 待 过 很 长 一 段 时 间 。 我 敢 打赌 我 的 表 兄妹 们 肯定 不 敢 相 信 他 们 的 萨 达 姆 数 
字 届 然 是 5。 也 许 我 的 陕 达 姆 数字 还 会 更 小 ， 但 是 没有 类 似 于 MathSciNet 这 样 的 
数据 库 来 专门 统计 。 

现在 你 可 能 得 出 了 这 样 的 结论 : 没有 什么 事情 可 以 让 一 位 概率 学 家 感到 惊 
奇 。 我 也 在 试图 让 你 相信 你 自己 也 觉得 没有 什么 事情 还 能 让 你 感到 惊讶 的 。 当 你 
被 内 电击 中 ， 当 你 中 了 乐 透 大 奖 ， 你 应 该 快速 地 计算 一 下 概率 ， 然 后 淡定 地 说 ， 
难道 这 不 是 注定 要 发 生 的 吗 ? 我 无 法 告诉 你 该 如 何 生活 ， 但 是 你 可 以 用 下 面 的 例 
子 自 我 检测 。 你 在 街 上 漫步 ， 罕 然 遇 到 了 你 上 高 中 时 心仪 的 那个 帅哥 〈 美 女 )， 
他 (她) 没有 带 婚 戒 ， 冲 你 微笑 给 你 了 一 个 大 大 的 拥抱 ， 然 后 表示 这 么 多 年 之 
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后 与 你 偶遇 太 不 可 思议 了 。 你 需要 选择 一 个 恰当 的 回复 :“ 是 的 ， 多 不 可 思议 啊 ! 
我 们 一 块 去 喝 一 杯 吧 。” 还 是 “从 概率 的 角度 上 说 ……” 





3.3 小 小 风险 


迄今 为 止 我 们 所 知 的 小 概率 大 多 数 都 能 直接 运算 出 来 。 其 他 的 小 概率 则 必须 
根据 数据 进行 估算 (回想 一 下 1.1 节 中 所 介绍 的 统计 概率 )。 以 多 种 风险 评估 作 
为 例子 (这 是 保险 公司 一 直 在 做 的 事情 ) 。 詹 姆 士 : 伯 克 在 他 1992 年 出 版 的 著作 
《概率 : 日 常生 活 中 的 风险 和 赔 率 》 一 书 中 告诉 我 们 人 被 内 电击 中 的 概率 是 六 十 
万 分 之 一 ， 遇 到 致命 性 空难 (但 自己 不 一 定 丧 命 ) 的 概率 是 一 千 万 分 之 一 点 六 。 
这 种 数据 只 能 通过 统计 方法 来 得 出 (在 第 8 章 会 详细 地 介绍 ) 。 被 闪电 击 中 的 概 
率 就 是 用 某国 某 年 内 被 内 电击 中 的 人 数 (对 于 伯 克 先 生来 说 就 是 英国 ) 除 以 总 
人 数 。 当 然 ， 被 闪电 击 中 的 风险 取决 于 你 是 谁 还 有 你 做 了 什么 。 如 果 你 酷爱 高 尔 
夫 而 且 在 在 糟糕 的 天 气 依然 坚持 打 高 尔 夫 ， 那么 你 就 是 被 闪电 击 中 高 危 人 群 
了 SS。 如 果 在 暴风 雨天 气 你 从 不 出 门 ， 那 么 你 很 安全 。 即 使 你 被 击 中 ， 你 仍然 有 
相当 大 的 机 会 活命 ， 因 为 只 有 大 约 十 分 之 一 的 电击 是 致命 的 。 空 难 概率 的 计算 与 
此 类 似 ， 也 就 是 用 发 生 过 空难 的 航班 数 除 以 总 航班 数 。 

由 于 小 概率 是 用 各 种 数据 计算 出 来 的 ， 所 以 它 的 浮动 范围 很 大 ， 特 别 是 当 缺 
乏 数 据 时 。 对 于 民航 安全 来 说 ， 致 死 事 故 率 是 每 一 百 万 次 航班 中 的 致死 事故 总 数 
(因为 起 飞 和 降落 是 整个 飞行 中 最 危险 的 时 刻 ， 这 样 的 计算 方法 比 依照 飞行 公里 
数 统计 要 合理 得 多 ) 。 协 和 式 超 音速 客机 一 度 是 世界 上 最 安全 的 飞机 ， 直 到 2000 
年 7 月 25 日 发 生 了 险 机 事件 。 因 为 协和 式 超 音 速 客机 总 共 只 飞行 了 八 万 次 ， 致 
死 事故 率 立 即 从 零 升 到 了 八 万 分 之 一 或 者 说 每 一 百 万 次 飞行 中 就 会 失事 十 二 次 ， 
从 而 成 为 史上 最 危险 的 飞机 型 号 。 短 时 间 内 ， 协 和 式 超 音速 客机 就 从 最 安全 的 飞 
机 变 成 了 最 危险 的 飞机 ! 把 它 的 数据 和 飞行 次 数 最 多 的 飞机 波音 737 相 比 。 波 音 
737 大 概 飞行 一 亿 五 百 万 次 ， 致 死 事故 率 是 一 百 万 次 中 的 0.41。 即 使 波音 737 飞 















































”顺便 告诉 大 家 ， 闪 电 有 时 会 连续 击 中 某 些 人 。 对 于 罗 伊 . 苏 利文 来 说 ， 他 被 击 中 了 7 次 。 这 个 美 
国 公园 管理 员 跟 托 尔 〈 译 者 注 : 北欧 神话 中 司 雷 、 战 争 及 农业 的 神 ) 有 莫大 的 渊源 ， 所 以 雷神 并 
没有 臂 死 他 。1983 年 的 时 候 ， 苏 利文 自杀 了 ， 自 杀 的 原因 跟 气 候 现 象 没有 任何 关系 。 
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机 再 次 失事 ， 对 这 一 数据 也 不 会 有 太 大 影响 。 因 为 这 种 稳定 性 ， 这 种 数据 对 波音 
737 来 说 远 比 协和 式 超 音速 客机 要 有 意义 得 多 。 

这 个 客机 的 例子 说 明了 既 要 理解 又 要 恰当 地 对 比 小 概率 是 多 么 的 不 容易 。 青 
举 一 个 例子 ，2000 年 ， 瑞 典 的 谋杀 率 是 瑞士 的 两 倍 。 在 瑞典 ， 每 十 万 人 当中 就 
有 1. 97 个 凶杀 犯人 ， 而 在 瑞士 ， 只 有 0. 96 (作为 比较 , 美国 的 谋杀 率 是 5.64， 
南非 最 高 ， 有 50. 14) 。 从 统计 学 上 来 讲 ， 你 在 瑞典 被 谋杀 的 概率 是 在 瑞士 的 两 
倍 ， 但 这 很 难 改变 你 的 度假 计划 。 在 《概率 : 日 常生 活 中 的 风险 和 赔 率 》 一 书 
中 ， 詹 姆 士 : 伯 克 提 到 1992 年 的 卢森堡 是 欧洲 谋杀 率 最 高 的 国家 。 然 而 到 了 
2000 年 ， 卢 和 森 堡 的 谋杀 率 就 变 得 很 低 了 。 这 种 浮动 在 卢森堡 这 种 人 口 少 的 国家 
是 非常 典型 的 : 杀人 犯 的 人 数 的 微小 变化 就 会 使 得 谋杀 率 大 幅 上 升 。 再 来 看 看 这 
个 ， 瑞 士 卫 队 司 令 阿 洛 伊 斯 ， 埃 斯 特 曼 和 其 夫人 在 栖 带 冈 被 杀 ， 使 当地 的 谋杀 率 
从 零 一 下 子 超过 了 五 百 分 之 一 ， 居 世界 首位 。 第 二 年 ， 它 又 降 回 到 零 。 但 在 人 口 
多 的 国家 这 样 的 计算 就 比较 合理 了 ， 即 使 杀人 犯 增加 了 两 倍 甚至 是 三 倍 ， 风 险 依 
然 还 是 很 小 。 

那么 ， 因 被 流星 砸 到 而 丧命 的 概率 又 是 多 少 呢 ? 这 很 难 回答 ， 因 为 还 从 未 发 
生 。 在 1911 年 ， 埃 及 的 一 只 狗 曾 被 流星 砸 死 ，1964 年 阿拉 巴 马 州 锡 拉 科 加 的 
安 . 道奇 丝 也 曾 被 流星 砸 中 ， 但 大 难 不 死 。 面 对 这 些 只 有 很 少数 据 的 案例 ， 想 必 
保险 精算 师 都 没 办 法 佑 算出 你 的 人 身 险 的 风险 。 当 然 ， 人 还 会 因为 其 他 一 些 高 空 
坠 物 而 死 。 比 如 说 ， 在 公元 前 456 年 ， 一 只 老鹰 飞 过 古 希 腊 剧 作家 埃 斯 库 罗 斯 的 
头顶 ， 鹰 抓 着 的 乌龟 砸 下 来 导致 其 当场 死亡 。 所 以 不 用 担心 被 陨石 磺 到 ， 从 统计 
角度 来 说 ， 你 被 高 空 险 下 的 乌龟 砸 死 的 概率 反而 要 大 得 多 。 



















































































3.4 为 什么 偏 是 百 万 分 之 一 


我 们 常常 用 百 万 分 之 一 来 描述 那些 生活 中 难得 一 见 的 事物 。 网 上 快速 搜索 得 
出 的 结果 显示 ,“ 百 万 分 之 一 ”这 个 词 的 使 用 频率 大 概 是 “万 亿 分 之 一 ”“ 十 亿 
分 之 一 ” “十 万 分 之 一 ”和 “万 分 之 一 ”这 些 词 使 用 次 数 的 总 和 的 20 倍 。 当 搜 
索 无 边 无 际 分 之 一 的 时 候 ， 搜 索引 擎 就 会 问 你 “是 不 是 想 查 询 百 万 分 之 一 ” 。 用 
《 宋 飞 正 传 》 中 克 莱 默 的 话 来 说 就 是 可 以 用 “ 百 万 分 之 一 的 概率 ， 博士， 只 是 百 
万 分 之 一 ”这 句 话 来 结束 每 一 个 “直肠 科 医 生 的 故事 ”。 
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那么 ， 为 什么 是 一 百 万 呢 ? 当然 ， 从 语言 层面 来 说， 一 百 万 的 发 音 比 其 他 数 
字 要 容易 得 多 。 在 我 看 来 ,一 百 万 虽然 是 个 大 数字 但 在 现实 生活 中 我 们 还 是 常常 
会 用 到 它 。 比 如 说 在 计算 国家 和 大 城市 的 人 口 时 ， 在 一 个 中 型 城市 的 预算 中 ， 卖 
座 电影 的 票房 ， 老 虎 伍兹 的 月 收入 ， 都 会 用 一 百 万 作为 单位 。 我 还 找到 了 一 些 证 
据 来 证 明 数 字 也 像 货 币 一 样 在 不 断 地 膨胀 。 在 1869 年 ,我们 的 老 朋 友 弗 朗 西 
斯 … 高 尔 顿 事 士 是 这 样 定义 “杰出 ”人 才 的 : 

“我 所 说 的 杰出 人 才 ， 他 的 成 就 在 一 百 万 人 中 只 有 二 百 五 十 人 可 以 做 到 ， 换 
名 话说 每 四 千 人 中 只 有 一 个 人 能 做 到 。 四 千 是 个 很 大 的 数字 ， 这 让 那些 不 熟悉 大 
数字 集合 的 人 们 难以 理解 。” 

一 一 弗朗西斯 . 高 尔 顿 器 士 ， 一 位 遗传 学 天 才 ， 写 于 1869。 

那些 可 以 被 称 为 百 万 分 之 一 的 事物 ， 高 尔 顿 才 称 之 “伟大 的 ”， 并 且 认 为 一 
百 万 是 个 难以 企及 的 大 数字 。 也 许 ， 随 着 时 间 的 流逝 和 数字 的 不 断 脱 胀 ， 我 们 会 
对 十 亿 这 样 的 单位 越 来 越 司 空 见 惯 ， 克 莱 默 在 新 版 的 《 宋 飞 正 传 》 中 就 会 重新 
说 这 段 话 了 。 

那么 百 万 分 之 一 到 底 是 多 少 呢 ?电影 《白头 神探 》 中 快 嘴 弗 兰 克 : 德 雷 宾 
( 莱 斯 利 . 尼尔森 饰演 ) 有 这 样 一 段 对 话 : 

简 : 你 的 机 会 只 有 百 万 分 之 一 。 

弗兰克 ' 德 雷 宾 : 这 至 少 比 中 乐 透 有 望 。 

这 是 真 的 ， 至 少 对 于 累积 奖金 的 那 种 高 额 奖金 彩票 来 说 就 是 这 么 一 回 事 。 真 
正 的 大 钱 还 是 跨 州 彩票 乐 透 强 力 球 (现在 已 覆盖 27 个 州 ) 和 超级 百 万 (已 覆盖 
12 个 州 ) 。 在 强力 球 彩 票 中 你 需要 从 1 ~55 之 间 选 出 5 个 数字 ， 再 从 1 ~42 选 出 
一 个 “强力 球 号 码 ”， 所 以 一 共有 

Css x42 =146107962 
种 可 能 。 如 果 你 想 要 有 百 万 分 之 一 的 中 奖 率 ， 那 么 你 必须 选择 146 种 不 同 的 组 
合 。 而 百 万 大 博彩 的 中 奖 率 更 低 。 你 需要 从 1 ~56 选 出 5 个 号 码 ,， 再 从 1~46 选 
出 1 个 号 码 ， 这 样 就 有 






























































Ca x46 =175711536 
种 不 同 的 组 合 。 如 果 想 要 有 百 万 分 之 一 的 中 奖 率 ， 你 就 要 花 176 美元 。 当 然 ， 部 
分 数字 符合 就 能 中 的 小 奖 的 概率 要 大 得 多 ， 大 概 有 四 十 分 之 一 。 
如 果 你 玩 桥 牌 的 话 ， 你 手 里 拿 到 十 张 红 桃 和 其 他 花色 各 一 张 牌 的 概率 差不多 
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也 是 百 万 分 之 一 。 相 比 来 说 在 玩 扑 现时 拿 到 皇家 同花顺 (同一 花色 从 10 到 A) 
的 概率 更 大 ， 大 约 有 一 百 万 分 之 一 点 五 。1963 年 肖 恩 . 康 纳 利 在 意大利 赌场 接 
连 三 次 拿 到 数字 17， 这 个 的 概率 显然 大 多 了 ,已 经 有 百 万 分 之 二 十 。 

有 些 时 候 ， 百 万 分 之 一 显得 没 那么 不 可 思议 。 如 果 我 们 说 某 件 事情 发 生 在 一 
个 人 身上 的 概率 只 有 百 万 分 之 一 ， 那 么 在 中 国 至 少 有 一 千 人 遇 到 过 这 种 事 ， 而 在 
美国 大 概 有 三 百 个 人 会 遇 上 ， 在 瑞典 可 能 有 九 个 人 会 遇 上 ， 就 连 在 斐济 岛 大 概 有 
位 仁兄 也 会 磁 上 。 

备 受 崇敬 的 英国 20 世纪 数学 家 李 特 尔 伍德 将 “奇迹 ”定义 为 “一 件 具有 重 
大 意义 的 事情 发 生 ， 且 发 生 的 概率 只 有 百 万 分 之 一 ”"。 然 后 ， 他 计算 得 出 每 个 人 
大 约 一 个 月 就 会 发 生 一 次 奇迹 。 这 理论 被 称 为 “ 李 特 尔 伍德 奇迹 法 则 ”， 广 为 流 
传 。 你 甚至 可 以 做 得 更 好 。 如 果 你 连续 抛 20 次 人 硬币， 你 会 得 到 不 同 的 正 反 面 朝 
上 的 情况 。 我 刚刚 抛 了 二 十 次 ， 得 出 的 顺序 如 下 : 

HTTHHTHTTHTTTHHTHTTT 
但 是 ,每 一 组 正 反 面 的 排列 的 概率 都 差不多 是 (1/2)”， 大 概 就 是 百 万 分 之 一 。 
我 刚才 扔 的 二 十 次 中 有 8 次 正面 向 上 ，12 次 反面 向 上 ， 这 看 起 来 并 不 特别 ， 但 
是 要 扔 出 一 模 一 样 的 顺序 ， 那 样 的 概率 还 是 真是 百 万 分 之 一 。 我 认为 这 件 事情 是 
具有 重大 意义 的 ， 而 且 概 率 也 非常 的 小 。 所 以 每 天 起 床 喝 杯 咖啡 ， 抛 二 十 次 硬 
币 ， 这 样 你 的 每 一 天 都 是 由 奇迹 拉 开 序幕 的 。 

现在 我 们 充分 了 解 了 什么 才 是 百 万 分 之 一 了 吧 。 那 么 就 留 个 小 练习 给 你 去 计 
算 下 什么 叫做 毫 无 机 会 吧 。 









































3.5 泊 松 分 布 和 神秘 数字 37 


如 果 让 你 任意 把 64 颗 米粒 摆 在 一 块 棋 盘 上 ， 你 会 空 出 多 少 格 呢 ? 如 果 某 件 
事 成 功 的 概率 是 百 万 分 之 一 ， 你 试 了 一 百 万 次 之 后 不 成 功 的 概率 是 多 少 呢 ? 在 科 
罗拉 多 州 的 杰克 逊 县 随便 选 定 一 平方 英里 的 范围 ， 然 后 在 里 边 溜达 不 遇 任 何人 的 
概率 是 多 少 ? 如 果 有 人 告诉 你 平均 每 一 千年 就 会 发 生 大 规模 的 陨 星 撞击 地 球 的 事 
情 ， 那 么 接 下 来 的 一 千年 里 会 有 多 少 流星 撞击 地 球 呢 ? 

这 些 问题 的 答案 都 是 37%。 在 2.5 节 中 介绍 的 网 购 例 子 时 也 出 现 了 这 个 数 
字 ， 人 金 盒子 的 最 佳 购物 策略 就 是 不 买 前 37% 的 产品 ， 而 是 从 中 选 出 一 个 最 好 的 
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产品 作为 基础 ， 当 37% 的 产品 之 后 的 产品 中 出 现 了 比 这 个 产品 还 要 好 的 产品 时 ， 
就 立刻 下 手 购 买 。 在 3. 1 节 中 提 到 的 凯撒 例子 中 ， 避 开 凯 撒 呼 出 的 气体 分 子 的 概 
率 也 是 37% 。37 这 个 数字 究竟 有 什么 特别 的 呢 ? 我 朋友 利夫 是 一 位 退休 的 瑞典 
数字 理论 学 者 。 他 时 常 告诉 我 37 既是 最 小 的 非 正 则 素数 又 是 最 大 的 序 素数 ， 虽 
然 我 不 懂 这 代表 什么 意思 。 同 时 37 也 是 人 体 正 常 体温 的 摄氏 度数 ， 亚 里 士 多 德 
还 认为 这 是 男性 最 佳 结 婚 年 龄 。 抛 开 这 些 数字 理论 和 伟大 的 希腊 哲学 家 ，37 的 
出 现 是 因为 0.37 是 e 的 近似 值 。 为 了 防止 有 些 读 者 对 这 个 数字 不 熟悉 ， 我 来 
简单 地 解释 一 下 。 数 字 e 是 所 谓 的 自然 对 数 算 法 的 基础 ， 对 于 数学 家 们 来 说 这 是 
最 重要 的 数字 (这 一 点 还 存在 争议 ， 有 人 认为 7 更 重要 )。e 的 值 是 
2. 718281828459…， 小 数位 无 穷尽 且 无 规律 可 循 .Oe-! 这 种 写法 是 1/e 的 变形 ， 
它 的 值 近似 于 0.3679…， 或 者 说 0.37。 

这 样 说 来 也 没有 多 神秘 ,但 是 为 什么 。” 出 现在 了 这 么 多 例子 中 呢 ? 这 与 
“小 概率 事件 定律 ” (law of rare events) 有 关 。 小 概率 事件 定律 是 指 一 个 事件 很 
少 发 生 ， 基 本 只 发 生 过 一 次 且 以 后 发 生 难 以 预测 ， 那 么 这 个 事件 不 再 发 生 的 概率 
为 ee 。 这 个 定律 可 以 运用 到 上 面 所 有 的 例子 中 去 。 将 棋盘 上 64 个 格子 中 的 某 一 
个 格子 定义 为 al (假设 是 最 靠近 执 白 棋 选 手 左手 边 的 那个 角落 ) 。 那 么 al 格子 
上 有 米粒 的 概率 非常 小 ， 只 有 1/64。 所 以 是 否 有 大 米 完全 无 法 预测 ， 且 不 论 你 
之 前 曾经 在 al 格 上 放 过 多 少 次 米粒 也 不 会 影响 这 一 次 事件 。 你 只 能 肯定 地 说 如 
果 你 放 了 64 次， 很 有 可 能 有 一 次 放 在 了 这 个 格子 上 。 当 然 你 有 可 能 依然 是 失败 
的 ， 因 为 小 概率 事件 定律 告诉 我 们 你 失败 的 概率 高 达 e ， 也 就 是 还 有 大 的 
37% 。 这 与 之 前 的 百 万 分 之 一 的 概率 一 样 ， 非 常 小 ， 难 以 预测 ， 尝 试 一 百 万 次 平 
均 也 只 会 成 功 一 次 。 科 罗拉 多 州 的 杰克 逊 县 的 人 口 密度 就 是 平均 每 一 平方 英里 一 
个 人 ， 所 以 当 你 随机 选择 一 个 地 点 时 想 要 遇 到 一 个 人 就 是 一 个 小 概率 事件 了 。 但 
是 如 果 你 把 杰克 逊 县 划分 成 各 个 平方 英里 的 区 域 ， 然 后 把 所 有 的 区 域 都 走 过 一 
遍 ， 你 平均 在 每 个 平方 英里 里 就 能 遇 到 一 个 人 。 因 为 人 们 并 不 是 平均 地 分 布 在 杰 






































” 当 谷 歌 在 2004 年 上 市 时 ， 公 司 在 提交 给 证 监 会 的 文件 中 写 道 他 们 预计 从 首次 公开 发 行 的 股票 中 募 
集 2. 718281828 十 亿 ( 译 者 注 : 为 了 方便 读者 理解 作者 举 这 个 例子 ， 此 处 并 没有 按照 中 文 习 惯 翻 
译 ， 而 是 保留 了 原 书 中 的 单位 一 一 十 亿 ) 美金 的 资本 。 昌 然 它 们 最 终 只 募集 到 了 10 亿 的 股本 ， 
并 没有 达到 目标 ,但 是 光 这 一 点 就 值得 数学 家 们 为 他 们 叫好 。 
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克 撑 县 各 个 地 方 的 ， 所 以 你 没有 办 法 预测 在 什么 区 域 会 碰见 他 们 。 此 时 小 概率 事 
件 定律 又 会 发 挥 作用 ， 你 在 某 一 个 选 定 的 区 域 遇 不 到 任何 人 的 概率 是 37%。 大 
规模 陨 星 撞击 地 球 的 时 间 也 是 稀少 而 无 法 预测 的 ， 基 本 上 一 千年 才 会 发 生 一 次 ， 
那么 某 一 个 千年 时 间 内 没有 发 生 的 概率 也 是 37% 。 细 想 一 下 你 就 会 发 现 大 概 有 
37% 的 人 一 非 子 都 不 会 经 历 那 种 千 载 难 着 的 事情 了 。 

那么 当 某 一 个 事件 平均 发 生 的 概率 是 两 次 、 三 次 甚至 更 多 次 呢 ? 如 果 我 们 想 
要 知道 的 是 这 类 事件 发 生 一 次 、 两 次 甚至 更 多 次 的 概率 呢 ? 小 概率 事件 定律 的 运 
用 范围 远 远 不 局 限于 我 在 上 一 段 中 介绍 的 情况 ， 它 还 有 其 他 的 适用 情况 。 假 设 某 
一 稀有 无 法 预测 的 事件 平均 发 生 的 概率 和 A (希腊 字母 “lambda”) ， 发 生 次 数 上 符 





合 泊 松 分 布 ， 其 路 =0，1，2，…， 那 么 可 以 得 出 公式 
Ek 
P( 出 现 k 次 ) =e x 


在 这 样 一 种 非常 模糊 的 假设 前 提 之 下 可 以 运用 这 样 一 个 精确 的 公式 来 计算 一 个 稀 
有 难以 预测 事件 发 生 的 概率 。 这 个 公式 的 推导 需要 将 之 前 作出 的 口头 上 的 假设 转 
化 为 数学 上 的 假设 ， 本 书 就 不 再 袭 述 了 。A 是 泊 松 分 布 中 的 参数 (大 家 可 以 回忆 
一 下 在 1.9 节 中 我 们 是 如 何 用 这 个 术语 来 形容 二 项 式 分 布 的) 。 在 上 面 的 例子 中 
我 为 了 方便 理解 将 和 的 值 设 定 为 1; 因此 发 生 0 次 的 概率 总 是 等 于 e- (对 于 这 
个 概率 公式 的 第 二 因子 ， 我 们 必须 记 住 任何 数 的 0 次 寡 都 等 于 1，01! 也 等 于 1。) 
如 果 我 们 继续 在 棋盘 上 随意 摆 放 128 颗 米 粒 ， 平 均 每 一 个 格子 上 会 有 两 粒 米 。 此 
时 A=2,，e 习 二 0. 14， 通 过 计算 得 出 大 约 有 14% 的 格子 会 是 空 着 的 。 如 果 我 们 转 
而 计算 每 一 百年 中 大 规模 陨 星 撞击 地 球 的 概率 ， 此 时 入 =0.1， 陨 星 不 会 撞击 地 
球 的 概率 为 e-"1=0.9。 

泊 松 分 布 能 够 与 很 多 现实 中 的 数据 库 完 美 地 匹配 。 最 常见 的 一 个 例子 就 是 书 
籍 或 者 报纸 上 每 一 页 的 错误 数量 ， 此 外 还 有 一 串 DNA 的 某 些 序列 的 突变 次 数 ， 
关于 放射 性 衰变 的 计算 以 及 某 一 太空 区 域 中 恒星 的 数量 和 某 一 特定 网 页 的 点 击 量 
等 。 网 页 的 点 击 率 ? 雅虎 还 是 亚马逊 ? 这 些 网 站 的 点 击 量 并 不 低 吧 ? 其 实 这 取决 
于 不 同 的 时 间 标 尺 。 你 总 是 能 够 找到 一 个 时 间 标 尺 ， 在 那 一 段 时 间 中 点 击 量 很 
低 ， 这 个 标尺 也 许 是 毫秒 或 者 微 秒 。 因 为 点 击 量 是 由 全 世界 各 个 地 方 的 网 民 们 实 
现 的 ， 什 么 时 候 会 被 点 击 非常 不 确定 ， 因 此 泊 松 分 布依 然 适 用 。 通 常 来 说 仅仅 用 
“稀少 ”来 形容 是 不 够 的 ， 它 还 必须 是 “不 可 预测 ”的 。 一 旦 你 确定 了 某 一 个 时 
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间 标 尺 ， 并 且 当 时 事件 的 发 生 是 稀少 的 ， 它 们 也 不 会 有 任何 的 规律 可 遵循 。 读 者 
们 请 注意 “每 一 千年 都 会 有 大 规模 的 陨 星 撞击 地 球 ” 这 句 话 和 “ 千 禧 年 总 会 在 
每 一 千年 有 一 次 ”这 和 句 话 是 完全 不 一 样 的 。 两 个 事件 都 很 稀少 ， 但 是 显然 只 有 第 
一 个 事件 是 无 法 准确 预测 的 。 

泊 松 分 布 由 法 国 数 学 家 西 莫 恩 . 德 尼 . 泊 松 (Siméon-Denis Poisson ) 
(1781 一 1840) 在 1838 年 时 发 表 的 文章 中 提出 的 。 泊 松 分 布 早期 的 一 个 经 典 例子 
就 是 被 自己 马 踢 死 的 普鲁士 土 兵 的 数量 。 这 个 例子 是 一 个 非常 完美 的 例子 (并 且 
还 赋予 “成 功 ” 这 个 词 一 个 有 趣 的 意思 ) 。 这 个 例子 与 在 棋盘 上 放大 米 的 例子 不 
太一 样 ， 棋 盘 的 例子 中 成 功 的 概率 一 直 都 不 变 。 但 是 马 可 能 会 越 来 越 具 有 攻击 
性 ， 且 踢 起 人 来 越 来 越 有 技巧 。 尽 管 如 此 ， 只 要 成 功 的 概率 没有 大 幅度 地 变化 ， 
泊 松 分 布依 然 能 够 很 好 地 处 理 这 种 情况 。 

在 棋盘 例子 中 ， 我 们 同样 也 可 以 利用 3. 1 节 中 的 公式 来 计算 al 格子 上 没有 
米 的 概率 。 如 果 利 用 这 个 公式 ， 那么 p =1/64,， n=64， 从 而 得 出 

P(al 格子 上 没有 米 ) = (1 -1/64)“ =0.3 

得 出 来 的 数值 与 e 一 近似。 如 果 你 尝试 了 一 百 万 次 的 话 ， 只 不 过 是 把 64 次 知 用 一 
百 万 次 寡 替 换 ， 你 不 成 功 的 概率 依然 是 e … 。 当 并 足够 大 时 ， 有 

(1-1/n)"~e” 
更 准确 地 说 ， 当 nn 无 限 大 时 ， (1 -1/n)" 的 值 无 限 趋 近 于 e-'。 你 可 以 随便 给 
n 取 值 ， 然 后 自己 检验 一 下 这 个 公式 。 这 就 让 我 们 之 前 举 的 凯撒 的 例子 多 了 一 种 
解法 。 当 n=10”， 我 们 不 能 吸 进 凯 撒 气 体 分 子 的 概率 是 。"'。 我 想 大 概 是 詹姆斯 
可 士 的 刻意 安排 使 得 这 个 例子 中 p 恰巧 等 于 1/n， 所 以 能 够 吸 进 凯撒 气体 分 子 的 
数量 就 是 1。 这 也 使 得 他 最 终 能 够 说 “我 们 每 一 次 呼吸 都 能 吸 进 一 个 凯撒 气体 分 
子 ”( 其 实 詹姆斯 需 士 并 没有 像 我 这 样 计算 过 ) 。 

细心 的 读者 可 能 已 经 注意 到 了 我 们 现在 介绍 的 这 些 能 用 泊 松 分 布 来 解决 的 例 
子 其 实 也 可 以 用 二 项 式 分 布 来 解决 。 你 们 是 对 的 。 通 常 说 来 只 要 一 个 二 项 式 分 布 
中 p 足够 的 小 而 n 又 足够 大 ， 我 们 就 可 以 用 泊 松 分 布 来 计算 ,其 中 入 =n xp。 所 
以 当 并 没有 要 求 严格 计算 出 精确 值 时 ， 这 种 方法 可 以 简化 计算 。 因 为 运用 泊 松 分 
布 你 就 可 以 不 用 计算 C' 这 个 复杂 的 二 项 式 系数 ， 在 某 些 问题 中 ， 比 如 凯撒 问题 
中 也 不 用 再 四 舍 五 入 了 。 

让 我 们 最 后 再 举 一 个 配对 的 例子 。 设 定 一 个 整数 n， 然 后 不 按 顺 序 随机 写 下 
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1 ~n 的 数字 。 如 果 第 个 数字 恰好 就 是 的话 我 们 就 称 之 为 “一 对 ”。 当 n=5 
时 ，32541 这 串 数字 就 有 两 对 (2 和 4) ， 而 23451 这 串 数字 就 没有 任何 对 。 那 么 
一 串 数字 中 没有 任何 对 的 概率 是 多 少 ? 

这 个 问题 的 概率 显然 取决 于 的 大 小 ， 让 我 们 先 来 计算 几 个 简单 的 例子 吧 。 
当 n=2 时 ，12 的 顺序 中 有 两 对 ， 而 21 的 顺序 就 没有 对 。 所 以 配对 的 概率 是 
1/2。 当 n=3 时 ,一 共有 六 种 情形 ， 分 别 是 123、132、213、231、312、321, 其 
中 两 种 情形 (231 和 312) 是 没有 对 的 。 所 以 概率 是 1/3。 当 =4， 一 共有 二 十 
四 种 情形 ， 其 中 九 种 情形 没有 对 ， 概 率 为 9/ 24 = 0.375。 当 n=5, 概率 为 
44/120 二 0.37。 在 5 以 后 概率 就 跟 0.37 很 近 了 。 我 们 的 老 朋 友 37% 又 出 现 了 ， 
这 次 读者 们 不 会 再 觉得 神秘 了 吧 。 如 果 我 们 假设 有 一 对 的 概率 是 1/n( 说 服 你 自 
己 这 是 对 的 )， 且 n 非常 大 ， 这 时 配对 就 是 一 个 小 概率 事件 。 我 们 尝试 n 次 才 会 
得 到 一 对 ， 换 名 话说 平均 n 次 才 会 发 生 一 次 ,似乎 小 概率 事件 定律 在 此 处 也 可 以 
适用 。 这 个 假设 与 上 面 的 配对 问题 是 不 同 的 ， 因 为 连续 配对 成 功 并 不 是 独立 的 。 因 
为 假如 第 一 个 位 置 配 对 成 功 ， 那 么 第 二 个 位 置 也 配对 成 功 的 条 件 概率 时 1/(n -1) 
而 不 是 1/n。 这 就 说 明了 小 概率 事件 定律 的 适用 并 不 要 求 绝对 的 独立 性 。 如 果 
我 们 要 考虑 配对 是 对 的 数量 的 话 ， 有 一 些 数 还 是 可 以 用 到 泊 松 分 布 。 但 显然 
n 个 数字 中 不 可 能 有 7 -1 对， 所 以 泊 松 分 布 也 不 能 够 在 所 有 数 的 情况 下 都 能 完 
全 适用 。 

配对 问题 是 概率 的 经 典 问 题 之 一 ,通常 背景 都 是 一 个 笨拙 的 秘书 不 小 心 把 信 
汗 意 放 到 了 写 好 地 址 的 信封 中 ,或 者 派对 上 一 群 男人 随意 把 帽子 放 作 一 堆 ， 派 对 
结束 后 随便 拿 帽 子 。 不 管 数 量 大 小 ， 至 少 有 一 封 信 放 在 了 正确 的 信封 中 的 概率 ， 
至 少 有 一 个 人 拿 对 了 帽子 的 概率 都 是 63% 。 很 有 趣 吧 ， 至 少 这 个 答案 你 不 能 脱 
口 而 出 ， 需 要 经 过 计算 得 出 。 

数字 37 神秘 的 面纱 已 经 被 揭 开 了 。 但 是 毫 无 疑问 它 依然 是 最 大 的 序 素数 。 






































3.6 ”夜空 繁星 





稀有 而 不 可 预测 的 事件 都 有 一 个 特征 ， 即 扎堆 发 生 。 乍 听 起 来 可 能 违反 直 
觉 ， 因 为 稀有 的 事件 发 生 后 ， 我 们 预计 它 在 很 长 一 段 时 间 内 都 不 会 再 次 发 生 。 反 
之 ， 如 果 距 离 上 一 次 发 生 已 经 过 了 很 入， 我 们 预计 它 可 能 会 很 快 就 会 发 生 。 住 在 














生活 中 的 概率 趣事 


休斯顿 的 时 候 ， 我 常 听 到 人 们 说 这 座 城市 注定 要 迎接 一 场 有 飓风。 在 卡特 琳 娜 飓风 
来 袭 前 的 三 周 我 们 搬 到 了 新 奥尔良 。 新 奥尔良 的 人 们 就 没有 那么 紧张 了 ， 大 家 和 常 
常会 说 这 座 城 市 已 经 很 久 没有 受到 飓风 黎 击 ， 相 比 于 飓风 人 们 更 关心 0” Briens 
酒吧 的 高 脚 杯 。 我 钦佩 于 他 们 的 态度 ， 但 这 里 的 堤坝 防洪 质量 太 差 。 每 一 次 由 风 
(在 短 时 间 内 稀有 ， 而 且 直 到 开始 形成 前 都 是 不 可 预测 的 ) 的 秦 击 都 和 以 前 秦 击 
的 地 点 和 强度 无 天 。 尚 未 发 生 的 都 不 能 是 “注定 ”发 生 , 一 旦 发 生 你 就 不 再 安 
全 了 《只 需 问 问 佛 罗 里 达 人 ) 。 发 生 就 是 发 生 ， 你 无 法 回避 。 

其 他 的 事情 也 是 如 此 。 假 设 医生 告知 你 患 上 一 种 严重 的 病 , 存活 机 会 只 有 
50% 。 他 继续 说 ,“ 但 是 ， 你 很 幸运 ， 因 为 我 的 上 个 病人 死 了 ”。 这 时 我 建议 你 
赶紧 从 这 个 庸 医 那 离开 吧 。 让 我 们 再 用 轮 盘 来 说 明 这 个 问题 。 每 转 38 轿 ， 所 有 
的 数字 都 会 平均 出 现 一 次 。 但 你 当然 不 会 预期 每 次 发 生 都 是 刚好 38 圈 。 那 么 每 
个 单独 的 数字 出 现 的 典型 模式 是 什么 呢 ? 我 曾 用 计算 机 模拟 上 百 次 轮 盘 转圈 ， 并 
记录 下 数字 29 每 两 次 出 现 之 间 转 过 的 圈 数 。 以 下 是 前 10 轮 的 圈 数 : 

8, 43, 20, 77, 52, 6, 9, 162, 22, 30 
请 注意 这 些 剧 烈 的 波动 。 有 一 次 竟然 转 了 162 圈 后 才 又 回 到 29 ， 而 另 一 次 只 转 了 
6 圈 就 义 得 到 了 29。 这 些 数字 的 平均 值 约 为 43， 与 38 足够 接近 ， 表 明 未 必 有 何 
异常 。 事 实 上 ， 当 你 看 到 有 些 事情 太 有 规律 了 ， 你 反而 应 该 怀疑 。 比 如 下 面 的 
序列 . 

35, 29, 28, 44, 46, 40, 45, 50, 25, 47 
平均 值 为 39， 与 38 非常 接近 。 但 不 论 是 现实 中 还 是 计算 机 模拟 中 ， 这 组 序列 都 
不 像 是 轮 盘 赌 的 结果 ， 因 为 这 些 数字 太 有 规律 了 。 这 组 序列 完全 是 我 随意 编造 
的 ， 没 有 采用 任何 随机 的 方法 。 

夜晚 的 繁星 为 我 们 提供 了 观察 聚集 的 直观 例子 。 只 要 抬头 观看 ， 你 就 会 发 现 
星星 簇拥 成 一 群 一 群 的 。 当 然 ， 引 力 的 原因 使 星星 并 非 完 全 相互 独立 ,但 这 种 相 
互 间 的 影响 不 足以 使 星星 在 夜空 中 形成 近似 泊 松 分 布 。 如 果 有 一 天 猎户 星座 (你 
若 在 南半球 ， 那 么 就 是 南 十 字 星 座 ) 消失 ， 星 星 们 都 整齐 地 排 在 网 格 中 ， 肯 定 非 
常 令 人 惊讶 。 图 3-1 所 示 为 两 幅 计 算 机 模拟 的 星 图 。 我 想 你 肯定 也 觉得 左 图 更 像 
真实 夜空 的 一 角 。 随 机 性 并 不 导致 规律 性 ， 事 实 上 恰恰 相反 。 这 也 是 为 什么 古人 
能 在 星空 中 找 出 图 案 ， 用 多 种 多 样 的 动物 和 其 他 物品 来 为 它们 命名 。 如 果 你 看 到 
我 随机 排 布 的 星星 ， 你 也 能 创造 自己 的 星座 。 






































第 3 章 微乎其微 的 概率 : 为 什么 奇迹 总 会 发 生 


加 左 图 中 的 25 
颗 星 完全 随机 分 
。 ”| 布 , 而 右 图 中 的 星 
”| 则 排列 在 网 格 中 ， 
掺 杂 一 点 随机 的 
入 变化 。 

















图 3-1 两 个 模拟 的 星空 图 


到 达 站 台 的 公交 车 是 一 个 既 不 随机 也 不 规律 的 例子 ， 到 达 时 间 具 有 一 定 程度 
的 随机 性 ,但 司机 先生 们 是 努力 按照 时 间 表 运营 的 ， 你 会 发 现 其 中 有 太 多 的 规律 
性 以 至 于 无 法 用 泊 松 分 布 来 描述 固定 时 间 段 进 站 车 的 数量 。 因 为 在 这 一 段 时 间 内 
进 站 的 公交 车 可 能 在 数量 上 是 很 少 的 , 但 是 它们 并 不 是 完全 无 法 预测 的 ， 所 以 并 
不 能 适用 小 概率 事件 定律 。 


3.7 结语 


这 章 中 介绍 了 概率 问题 中 最 有 意思 的 概率 : 小 概率 。 我 们 切忌 忽略 它们 ， 
为 一 个 事件 即使 再 稀有 也 不 意味 着 它 永 远 不 会 发 生 。 事 实 上 极端 稀有 的 事件 时 时 
刻 刻 都 在 发 生 。 当 说 到 一 个 事件 是 小 概率 事件 时 你 必须 立刻 想到 : “究竟 做 了 多 
少 次 试验 就 说 这 个 事件 稀有 了 呢 ?” 不 管 机 会 有 多 小 ， 你 要 坚信 “有 志 者 ， 事 竟 
成 ”"。 问 问 亚当 斯 就 知道 了 ,或 者 吸 进 一 个 凯撒 气体 分 子 吧 。 



































在 所 有 的 数学 发 现 中 ， 贝 叶 斯 法 则 是 应 









































最 多 的 法 则 之 一 ， 它 从 最 开始 的 籍 












































见 在 广泛 被 认可 并 应 用 于 各 个 领域 。 本 章 着 重 介绍 了 其 刀 











































































































































































































其 在 “概率 侦探 工 
I 应用， 其 中 包括 如 何 应 用 其 在 庭审 中 做 出 判决 以 及 如 何 应 用 其 来 做 疾病 
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第 4 章 后 向 条 件 概率 : 回头 是 岸 


4.1 载 着 售 西 小 姐 回 家 


在 本 章 中 我 们 将 继续 介绍 条 件 概 率 。 回 想 一 下 之 前 的 内 容 ， 我 们 认为 如 果 在 
计算 一 个 事件 概率 时 需要 考虑 其 他 信息 则 需要 用 到 条 件 概 率 。 为 了 省 去 你 再 翻 回 
前 面 重 温 这 些 知 识 的 麻烦 ， 这 里 再 一 次 介绍 条 件 概 率 的 基本 公式 。 如 果 事 件 B 的 
发 生 要 以 事件 4 的 发 生 为 前 提 ， 则 





P(4 与 B) 
P(A) 


仅 当 事件 4 与 事件 B 是 相关 事件 时 ，P(B 14) 才 与 P(B) 不 同 。 如 果 事 件 4 与 事 
件 B 相互 独立 ,它们 才 不 会 对 对 方 的 概率 产生 影响 。 换 而 言 之 ,条件 概率 就 是 在 
某 个 事件 的 发 生 条 件 上 增加 一 些 不 相关 的 信息 。 

当然 我 们 还 可 以 用 其 他 方法 来 计算 条 件 概率 。 事 件 “B 与 4” 与 事件 “4 与 
B” 是 相同 的 ,而 P(4 与 B) 又 可 以 通过 P(B 14)xP(4) 得 出 ， 所 以 可 以 得 出 如 
下 公式 : 


P(B|A)= 





PC41B) -人 人 全 


这 也 是 著名 的 数学 家 托马斯 - 贝 叶 斯 (Thomas Bayes) (1702 一 1761) 提出 的 贝 
叶 斯 法 则 (也 称 为 贝 叶 斯 定理 )。 但 是 贝 叶 斯 自己 并 没有 公开 发 表 这 一 重大 发 
现 ， 而 是 他 的 朋友 在 他 去 世 之 后 整理 他 的 遗 稿 时 发 现 的 。 这 位 18 世纪 英国 教士 
留 下 的 不 起 眼 的 公式 给 整个 科学 界 和 统计 学 界 带 来 深远 的 影响 。 因 为 如 果 直 接 计 
算 P(B|4) 非 常 简单 ， 但 是 想 要 反 向 计算 P(4 | B) 就 不 是 那么 容易 了 。 贝 叶 斯 法 
则 使 得 这 种 计算 易如反掌 。 贝 叶 斯 法 则 还 有 更 加 复杂 的 变形 ， 现 在 常见 的 电子 邮 
件 垃圾 邮件 过 滤器 和 互联 网 搜索 引擎 里 都 用 到 了 它 。 接 下 来 我 们 会 重点 关注 贝 叶 
斯 法 则 在 衡量 证 据 方面 (比如 在 体检 时 、 或 在 法 庭 上 ) 发 挥 的 无 可 估量 的 作用 。 
但 首先 还 是 让 我 们 先 去 旁边 的 酒吧 坐 坐 吧 。 

你 主动 载 喝 醇 的 售 西 回 家 ， 但 是 她 却 拒绝 了 。 她 刚 从 新 闻 里 知道 25% 的 车 
祸 都 是 由 酒 驾 引起 的 。 伪 西 想 要 自己 开车 回去 ， 她 说 :“ 你 们 这 些 清醒 的 人 要 对 
剩 下 的 75% 的 车 祸 负 责任 。 你 们 这 些 马 路 杀手 ， 能 离 马 路 多 远 就 走 多 远 。” 你 回 
答 说 ， 你 就 应 该 叫 Stevie Wonder ( 译 者 注 : Stevie Wonder 是 一 位 盲人 歌手 ) 来 开 
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车 载 你 回去 ， 在 你 们 家 乡 很 久 都 没有 报道 过 盲人 音乐 家 驾驶 发 生 事故 。 

你 的 回答 让 集 西 捧腹 大 笑 ， 最 后 她 终于 答应 让 你 开车 载 她 回去 了 ， 但 其 实 你 
心 并 不 确定 你 反 驭 她 的 话 有 没有 道理 。 现 在 贝 叶 斯 法 则 就 能 够 把 事情 整理 清楚 ， 只 
不 过 我 们 还 需要 一 些 具体 的 数据 。 假 设 酒吧 附近 的 街道 上 驾驶 的 司机 们 有 95% 都 是 
清醒 的 ， 他 们 驾驶 发 生 事故 的 概率 是 1%。 那 么 你 和 伐 西 各 驶 发 生 事故 的 相关 事件 
就 是 你 清醒 驾驶 时 发 生 事故 的 事件 P(4 | 5)， 而 你 醉酒 驾驶 发 生 事故 的 条 件 概 率 是 
P(4 |D)。( 译 者 注 : 4 代表 英文 单词 accident 事故 ，$ 代表 的 是 英文 单词 sober 清 
醒 ， 而 D 则 代表 英文 单词 drunk 醉酒 。) 已 知 P(D|A4) =0.25, P(S |A) = 0.75， 
P(D) =0.05，P(S) =0.95，P(4) =0.01 。 利 用 公式 可 以 计算 出 : 


_P(S|A)xP(A) 0.75 x0.01 
US P(S) ”0.95 


即 你 有 0. 8% 的 可 能 发 生 和 驾驶 事故 。 另 外 一 方面 ， 集 西 发 生 事故 的 概率 为 
5%， 妈 














一 0. 008 








_P(D|A)xP(A) 0.25 x0.01 
PA P(D) ”0.05 


所 以 她 当然 应 当 坐 在 副 和 驾驶 座 上 (其 实 后 排 座 位 更 安全 )。 她 犯 了 一 个 常见 的 错 
误 , 把 P(D14) 与 P(4 | 也 ) 等 同 起 来 了 。 醇 酒 驾驶 发 生 事故 占 所 有 驾驶 事故 的 
25% ， 这 个 数字 必须 与 醉酒 驾驶 司机 的 数量 结合 起 来 才 是 一 个 真正 相关 的 数字 。 
因为 酒 驾 的 司机 远 远 没有 占 到 司机 数量 的 25% ， 所 以 他 们 引起 的 事故 比例 相当 
的 大 。 

P(A4 1D) 无 法 从 我 们 已 知 的 数据 中 直接 计算 出 来 。 当 你 知道 了 车 祸 事 故 的 总 
数 以 及 司机 的 总 数 你 能 计算 出 发 生 事故 的 平均 概率 。 通 过 交警 测 呼吸 和 血液 里 的 
酒精 浓度 ， 你 可 以 知道 多 少 事故 是 由 酒 驾 引起 的 。 但 是 你 没有 办 法 直接 计算 出 醉 
酒 驾驶 发 生 事故 的 概率 ， 因 为 你 不 知道 那些 没有 发 生 事故 的 酒 世 数量 。 但 在 知道 
了 酒 驾 司 机 的 比例 (可 以 通过 交通 检查 站 点 做 的 数据 统计 也 可 以 随机 匿名 调查 人 
们 的 饮酒 和 开车 习惯 )， 贝 叶 斯 法 则 就 能 帮助 你 准确 地 估算 出 P(4 1D) 的 值 。 

把 P(418) 与 P(B |14) 混 淆 起 来 是 常 犯 的 一 个 错误 。 我 年 轻 的 时 候 非 常 喜欢 
Ed McBain“ 八 十 七 分 局 ”系列 侦探 小 说 中 虚构 的 城市 一 一 艾 索 拉 。 我 记得 其 中 
的 一 个 场景 就 是 一 个 意大利 裔 美国 人 在 看 到 一 个 电视 节目 把 意大利 人 描绘 成 为 歹 
徙 之 后 他 非常 慎 怒 。 他 去 电视 台 抗 议 得 到 了 这 样 的 回复 “歹徒 不 仅仅 只 是 意大利 
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人 ， 有 很 多 的 尹 徒 就 是 犹太 人 和 爱尔兰 人 。” 书 中 的 这 位 答复 人 员 非 常 聪明 ， 他 
立刻 区 分 出 了 “所 有 意大利 人 都 是 歹徒 ”和 “所 有 歹徒 都 是 意大利 人 ”这 两 者 
之 间 的 区 别 。 虽 然 这 不 是 一 个 纯粹 的 概率 问题 ， 但 是 我 们 还 是 可 以 用 概率 来 分 析 
它 。 电 视 节 目 将 P( 歹 徒 | 意大利 人 ) 当成 了 1， 而 现实 中 P( 意大利 人 | 尹 徒 ) 要 
小 得 多 。 

最 近 我 看 到 了 一 个 关于 艾滋 病 的 问题 , “通过 血液 传播 感染 艾滋 病 的 风险 有 
多 高 ?”， 随 即 附 上 的 答案 说 2% 的 艾滋 病 患者 是 通过 血液 传播 感染 的 。 读 者 们 请 
注意 ， 问 题 问 的 是 P( 艾滋 病 | 血液 传播 ) 是 多 少 ,但 是 答案 回答 的 却 是 P( 血液 
传播 | 艾滋 病 ) 的 大 小 。2% 的 风险 足以 保证 大 家 的 输血 安全 ， 实 际 上 据 报 道 一 
百 万 次 输血 感染 的 次 数 只 有 不 到 一 次 。2% 只 是 表示 所 有 感染 艾滋 病 病毒 的 患者 
中 有 98% 是 通过 血液 传播 之 外 的 途径 感染 的 。 当 你 决定 要 输血 时 你 无 须 担 心 这 
个 数据 。 

所 有 的 单身 男女 们 ， 奉 劝 你 们 结婚 人 须 谨慎 哦 。 因 为 所 有 的 离婚 都 是 因为 先 结 
过 婚 。 











4.2 ” 贝 叶 斯 法 则 ， 小 球 与 男孩 ( 女孩) 


在 我 们 要 开始 严肃 讨论 医药 和 法 律 问题 之 前 ， 让 我 们 再 来 举 一 些 轻松 的 例子 
吧 。 一 个 盒子 里 放 着 两 个 白 球 和 两 个 黑 球 。 你 先 从 中 拿 出 一 个 球 ， 然 后 再 拿 第 二 
个 。( 当 你 拿 第 二 个 球 的 时 候 你 不 需要 把 第 一 个 球 再 放 回 盒 里 。) 考虑 以 下 两 种 
情况 : 

4: 第 一 个 球 是 黑 球 

B: 第 二 个 球 是 黑 球 
显然 P(4) =1/2， 当 你 已 经 拿 出 一 个 黑 球 之 后 ,盒子 的 三 个 球 中 只 剩 下 一 个 黑 球 
了 ， 所 以 P(B 14) =1/3。 目前 为 止 都 没有 什么 问题 了 。 但 P(4 |B) 是 多 少 呢 ? 
也 就 是 说 当 第 二 个 球 是 黑色 的 ， 第 一 个 球 也 是 黑色 的 概率 为 多 少 ? 

这 个 问题 好 像 需 要 我 们 倒退 从 后 往 前 想 问 题 。 难 道 不 是 1/2 吗 ? 毕竟 第 一 个 
球 都 已 经 取出 来 了 ， 它 怎么 会 受到 第 二 个 球 的 颜色 的 影响 呢 ? 

当然 不 会 受 影响 了 ， 它 们 是 不 相关 的 。 在 这 个 问题 上 你 不 应 该 按照 时 间 先 后 
顺序 考虑 ， 当 你 选 出 第 一 个 球 的 时 候 第 二 个 球 是 什么 颜色 谁 也 不 知道 。 你 应 当 把 
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先后 取出 这 两 个 球 当 做 一 个 完整 的 试验 ， 然 后 大 量 重 复 做 这 个 试验 。 首 先 把 第 二 
个 球 是 白 球 的 情况 排除 ， 当 抽出 的 两 个 球 是 白 球 / 黑 球 或 黑 球 / 黑 球 这 两 种 情况 的 
时 候 满 足 第 二 个 球 是 黑色 的 要 求 。 白 球 / 黑 球 情形 的 概率 是 1/2 x2/3 =1/3， 
球 / 黑 球 情 形 的 概率 是 1/2 x1/3 =1/6。 把 这 两 个 数 相 加 得 到 的 就 是 第 二 个 球 是 
黑 球 的 概率 1/2。 那 么 第 一 个 球 是 黑 球 的 概率 会 是 多 少 呢 ?” 出 现 白 球 / 黑 球 的 情 
形 是 出 现 黑 球 / 黑 球 情形 的 两 倍 。 因 此 ， 当 我 们 进行 大 量 重复 试验 大 约 一 半 的 情 
形 中 第 二 个 球 是 黑色 的 。 那 么 有 多 少 种 情况 第 一 个 球 也 是 黑色 的 呢 ? 因为 出 现 白 
球 / 黑 球 是 出 现 黑 球 / 黑 球 概率 的 两 倍 ， 所 以 第 二 个 球 是 黑 球 时 出 现 黑 球 / 黑 球 情 
况 的 概率 是 1/3， 即 P(4 1B) =173。 
更 简单 的 方法 就 是 利用 贝 叶 斯 法 则 : 


P(B|A)xP(A) 1/3x1/2 
P(B) 2 


其 中 ，P(B) =1/2。 在 上 述 计算 中 我 们 其 实用 到 了 全 概率 法 则 : 
P(B) =P(B|A4)xP(4)+P(B|( 非 4))xP( 非 4) 
=1/3 x1/2 +2/3 x1/2=1/2 
这 是 贝 叶 斯 法 则 在 运算 中 的 典型 例子 。 随 便 设 定 两 个 事件 4 和 B。 假设 我 们 已 知 
P(B|14) 和 P(B | 非 4),， 需要 计算 的 概率 P(4 |B)。 贝 叶 斯 法 则 还 有 另外 一 种 


变形 ， 














P(41B) = 173 





























_ P(B |A)xP(A) 
P(4 1B) =prBTAxpeA) +P(BT (PEA PPEA) 


在 球 的 例子 中 ,计算 P(A 1B) 并 没有 比 计算 P(B |4) 难 多 少 , 但 是 这 两 个 条 件 概 
率 是 截然 不 同 的 。P(4 1B) 非 常 容易 理解 ， 就 是 你 从 盒子 中 取出 一 个 黑 球 ， 把 这 
个 事件 作为 前 提 再 从 盒子 中 取出 另外 一 个 黑 球 ， 此 时 拿 到 黑 球 的 概率 是 1/ 3。 
P(B |4) 则 相对 难以 理解 。 你 先 取 出 一 个 球 ， 握 在 手中 ,不 要 看 它 的 颜色 。 这 时 
拿 着 黑 球 的 概率 是 1/2。 你 继续 从 盒子 里 取出 另外 一 个 球 ， 发 现 这 个 球 是 黑色 
的 。 突 然 你 原来 手中 拿 着 的 球 是 黑 球 的 概率 从 1/2 变 成 了 1/3。 太 不 可 思议 了 
吧 ! 这 个 球 一 直 在 你 的 手 里 啊 , 为 什么 你 取出 男 外 一 个 黑 球 它 的 概率 就 变 
了 呢 ! 

这 些 概率 都 是 主观 的 ， 它 们 反映 出 你 自己 想法 的 坚定 程度 。 你 坚信 自己 手 上 
的 球 是 黑色 的 吗 ? 如 果 你 用 概率 去 量化 这 种 坚信 的 程度 的 话 ， 最 开始 你 认为 是 
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1/2。 但 当 你 第 二 次 拿 到 一 个 黑 球 时 你 就 稍微 没有 那么 坚信 自己 第 一 个 球 也 拿 到 
了 黑色 。 毕 竟 如 果 你 第 一 个 球 拿 到 的 白 球 ， 第 二 个 球 拿 到 黑 球 的 概率 才 更 高 .9 
通过 计算 概率 你 将 自己 坚信 的 程度 量化 成 1/3。 虽 然 概 率 是 主观 的 ， 但 它 并 不 
是 任意 的 。 它 通过 反复 进行 某 一 种 试验 ,然后 从 长 远 的 角度 上 进行 客观 的 
评价 。 

我 们 还 可 以 依据 新 信息 利用 贝 叶 斯 法 则 来 更 新 事件 概率 。 在 上 述 例子 中 ， 从 
盒子 里 取出 白 球 或 取出 黑 球 的 概率 都 是 1/2。 当 我 们 知道 了 第 二 个 球 是 黑 球 这 个 
信息 时 ， 我 们 就 把 概率 更 新 成 了 1/2 和 2/3。 用 概率 学 家 的 话 来 说 ， 原 来 取出 
| 黑 球 ， 白 球 | 的 概率 分 布 是 |1/2，1/2| ， 当 我 们 知道 第 二 个 球 是 黑色 时 ， 概 
率 分 布 变 成 了 |1/2，2/3|。 这 两 个 分 布 分 别 是 先 验 分 布 和 后 验 分 布 。 




















4.3 贝 叶 斯 法 则 与 医疗 诊断 


贝 叶 斯 法 则 在 医学 实验 中 也 发 挥 了 很 大 的 作用 。 让 我 们 来 举 一 个 例子 吧 。 假 
设 你 在 进行 某 种 疾病 的 排查 ， 这 种 疾病 在 人 群 中 的 发 病 率 是 1% 。 在 没有 任何 临 
床 症 状 时 ， 进 行 检查 化 验 ， 准 确 率 是 95% 。 我 指 的 是 当 你 确实 患 有 该 种 疾病 ， 
那么 化 验 结果 有 95% 的 可 能 是 阳性 ; 如 果 你 没有 患 病 ,那么 化 验 结果 有 95% 的 
可 能 是 阴性 的 。 那 么 当 你 的 化 验 结果 是 阳性 时 ， 你 患 病 的 概率 有 多 大 ? 

这 个 问题 看 起 来 很 简单 。 如 果 检 查 的 准确 率 是 95%， 那 么 你 得 病 的 概率 就 
是 95% 对 吗 ? 让 我 们 继续 用 贝 叶 斯 法 则 吧 。 令 事件 D 为 你 患 病 的 事件 ， 令 + 表 
示 化 验 的 结果 是 阳性 。 目 前 已 知 P(D) =0.01 即 发 病 的 概率 为 0.01。 而 化 验 的 准 
确 性 翻译 成 概率 语言 就 是 P(+ | D) =0.95。 但 是 现在 要 计算 的 是 当 化 验 结果 呈 
阳性 ， 你 患 病 的 概率 是 多 少 ， 即 P(D |+ ) 的 值 。 如 果 从 时 间 顺 序 来 理解 的 话 的 确 
也 是 如 此 ， 因 为 首先 是 你 得 病 或 没有 得 病 ， 之 后 你 采取 化 验 得 到 阳性 结果 。 将 贝 
叶 斯 法 则 运用 到 这 个 例子 中 可 知 ， 






































”我 举 一 个 更 极端 的 例子 可 能 有 助 于 大 家 理解 。 假 设 盒子 里 只 有 一 个 白 球 和 一 个 黑 球 。 你 一 开始 
取出 一 个 球 握 在 手 上 ， 然 后 青 拿 出 另外 一 个 球 ， 第 二 个 球 是 黑色 的 。 此 时 你 就 可 以 确定 第 一 个 
球 是 白色 的 。 
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_ P(+ |D)xP(D) 
P(D I+)=prrTDxPpOD) rp T( 韭 D) xP( 磊 D) 


在 整个 公式 中 只 有 P(+ | ( 非 7) ) 的 值 需 要 稍微 计算 一 下 。 


0.95 x0.01 _ 
0.95 x0.01 +0.05 x0. 99 


所 以 你 只 有 16% 的 概率 是 确定 已 经 患 病 的 ! 即使 化 验 的 结果 准确 率 高 达 95% ， 
你 也 可 以 保持 谨慎 的 乐观 ， 因 为 你 真正 患 病 的 概率 很 低 。 计 算 有 问题 吗 ? 当然 不 
是 。 在 这 个 例子 中 评估 患 病 的 风险 存在 两 个 冲突 的 信息 :这 个 病 非常 罕见 ， 所 
以 你 基本 不 可 能 患 病 ，@ 这 个 化 验 非常 的 精准 ， 所 以 当 检 验 结果 是 阳性 时 你 很 可 
能 就 患 病 了 。 这 两 个 信息 量化 之 后 对 应 的 概率 分 别 是 1% 和 95%， 所 以 实际 的 风 
险 应 当 在 这 两 个 数字 之 间 。 通 过 运用 贝 叶 斯 法 则 计算 得 出 的 最 终 概率 16% 恰好 
就 在 这 两 个 数 之 间 。 

很 多 人 都 会 把 P(+ 1D) 和 P(D |+ ) 和 弄 混 ， 这 其 中 包括 最 不 应 该 把 它们 弄 混 
的 人 : 1978 年 《新 英格兰 医学 杂志 》 中 发 表 了 一 篇 文章 ， 就 一 个 类 似 的 问题 向 
哈佛 医学 院 的 四 个 附属 医院 中 60 个 医生 提问 。 只 有 11 个 医生 回答 正确 ， 几 乎 一 
半 的 人 的 回答 都 是 95% 。 

在 计算 的 过 程 中 我 们 用 到 了 人 群 中 该 疾病 的 发 病 率 这 个 非 条 件 概 率 P(D)， 
即 所 谓 的 基本 比率 (比率 的 含义 与 概率 相似 ) 。 这 看 起 来 似乎 与 本 来 的 问题 不 相 
关 。 上 毕竟， 你 的 化 验 是 阳性 ， 且 当 你 确实 患 有 该 种 疾病 ， 化 验 结果 有 95% 的 可 
能 是 阳性 。 知 道 这 些 信 息 不 就 够 了 吗 ? 这 个 病 究竟 是 普遍 还 是 罕见 有 什么 关系 
呢 ? 这 的 确 有 关 。 这 个 病 越 罕见 ， 你 检查 出 来 阳性 的 结果 越 可 能 是 误诊 。 设 想 一 
种 极端 的 情况 ， 你 检查 的 这 种 病 从 来 没有 人 得 过 (可 以 用 男人 得 卵 人 梨 癌 ,女人 得 
前 列 腺 癌 等 这 些 无 知 的 例子 ) ， 化 验 结果 的 准确 度 高 达 95% 。 这 时 你 就 可 以 确定 
这 个 阳性 的 结果 肯定 是 误诊 。 反 之 疾病 越 常 见 ， 你 就 更 应 该 相信 检查 的 结果 。 另 
一 种 极端 的 情况 就 是 你 检查 的 这 种 病 每 个 人 都 患 有 ， 且 只 要 检查 结果 是 阳性 的 ， 
你 就 肯定 得 病 了 。 所 以 基本 比率 是 不 能 忽视 的 。 

在 上 述 的 例子 中 想 一 想 “ 如 果 很 多 人 都 来 做 检查 会 发 生 什 么 事情 ”能 帮助 
你 想 清 楚 问 题 。 一 万 人 中 大 概 有 100 个 人 患 有 疾病 ， 其 中 95 个 人 能 够 被 检查 出 
来 。 剩 下 9900 个 没有 患 病 的 人 中 ，5% 的 人 会 被 误诊 ， 这 样 就 有 495 个 人 还 会 得 
到 阳性 的 检查 结果 。 因 此 总 共有 检查 590 例 阳 性 病例 ,但 其 中 只 有 95 个 人 是 真 
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正 生 病 了 ， 概 率 大 概 是 16% 。 那 些 健康 的 人 被 误诊 的 检查 又 被 称 为 “ 假 阳 性 ”， 
而 那些 没有 检查 出 疾病 的 案例 则 被 称 为 “ 假 了 明 性 ” 。 我 在 上 一 段 中 提 到 比率 的 含 
义 与 概率 相似 ， 所 以 我 们 通常 会 说 “ 假 阳 性 比率 ”和 “ 假 阴 性 比率 ”。 在 这 个 例 
子 中 假 阳 性 比率 是 495/590 即 80% ， 而 假 了 明 性 比率 是 5/9410 即 0. 05% 。 

为 了 减少 假 阳 性 案例 ， 通 常会 对 那些 在 第 一 次 化 验 中 检查 出 阳性 的 人 再 做 一 
次 检查 。 假 设 第 二 次 检查 的 结果 与 第 一 次 检查 结果 之 间 是 相互 独立 的 ， 第 二 次 检 
查 的 准确 率 依然 是 95% 。 所 以 如 果 你 身 患 该 病 不 论 你 第 一 轮 的 检查 结果 如 何 ， 
在 第 二 轮 检查 中 化 验 结果 是 阳性 的 概率 是 0.95; 如 果 你 是 健康 的 ， 那么 你 得 到 化 
验 结果 是 阳性 的 概率 是 0. 05 。 唯 一 不 同 的 是 经 过 了 第 一 次 化 验 的 过 滤 ， 第 二 次 检 
查 的 基本 比率 变 成 了 0.16。 所 以 如 果 你 第 二 次 检查 的 结果 依然 是 阳性 ， 那 么 你 患 
病 的 概率 是 








0. 95 x0. 16 本 
0.95 x0. 16 +0.05 x0. 84 


换 而 言 之 ,依然 有 22% 的 假 阳性 存在 ， 但 是 比例 已 经 明显 下 降 了 。 经 过 了 上 一 
节 的 学 习 ， 你 也 许 会 想到 上 面 的 程序 是 连续 更 新 概率 。 一 开始 的 风险 是 1% ， 后 
来 升 到 了 16% ， 再 变 成 78% 。 如 果 没 有 贝 叶 斯 公式 的 话 这 些 概率 很 难 计算 出 来 。 

在 医学 检查 中 你 显然 想 让 “ 假 阳 性 比率 ”和 “ 假 阴 性 比率 ” 越 低 越 好 。 但 
是 存在 一 个 问题 ， 因 为 这 两 个 比率 是 此 消 彼 长 的 关系 。 不 管 你 做 什么 医学 检查 
(提问 、 血 型 、X 光 、 核 磁 共振 成 像 ……) ， 除 非 是 那些 确定 无 疑 的 病例 ， 总 是 会 
有 一 些 灰 色 区 域 不 是 那么 确定 的 。 如 果 你 想 要 降低 假 阳性 的 风险 ， 你 就 必须 让 
处 于 灰色 区 域 中 的 人 们 被 误诊 为 阳性 的 概率 降低 。 但 是 这 样 就 会 使 得 假 阴 性 的 
病例 变 多 ， 这 些 人 本 来 应 该 被 检查 出 来 但 现在 却 被 排除 了 。 反 之 ， 如 果 你 为 了 
减少 假 阴 性 的 病例 而 将 标准 变 低 ， 假 阳性 的 病例 就 会 变 多 。 你 在 阅读 的 过 程 中 
可 能 也 发 现 了 我 襄 欢 用 极端 的 例子 来 说 明 问题 。 现 在 再 举 一 个 极端 的 例子 ， 假 
设 检查 出 来 的 结果 每 个 人 都 是 阳性 的 。 这 样 就 没有 人 可 以 被 排除 ， 那 么 假 阴 性 
比率 就 为 0， 而 那些 健康 的 人 就 全 是 假 阳性 了 ， 所 以 假 阳性 的 比率 非常 高 。 对 
应 的 极端 例子 就 是 检查 出 每 一 个 人 都 健康 ， 那 么 假 阳 性 为 0， 而 假 阴 性 的 比率 
很 高 。 

现实 生活 中 有 很 多 这 样 的 例子 。 你 爱 车 的 发 动机 灯 罕 然 出 现 故 障 了 ， 但 是 你 
的 车 是 好 的 : 假 阳 性 。 安 过 . 罗 迪 克 发 球 出 界 ， 但 是 边线 裁判 没有 注意 到 : 假 
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阴性 。 

在 体检 中 保持 低 的 假 阴 性 是 最 高 准则 。 其 中 的 道理 就 是 发 现 越 多 病 患 越 好 。 
而 付出 的 代价 就 是 假 阳 性 的 人 数 也 会 增加 ， 这 相对 来 说 没有 那么 可 怕 。 但 是 假 阳 
性 比率 的 增加 也 会 带 来 很 多 麻烦 。 比 如 当 用 计算 机 断层 摄影 术 ( 即 CT) 来 检查 
肺癌 时 ， 假 阳性 比率 可 能 会 很 高 (根据 国家 癌症 研究 所 的 统计 有 时 高 达 50% ) 。 
通常 来 说 假 阳 性 是 把 良性 的 瘤 误诊 为 癌症 ， 但 是 在 手术 中 发 现 是 良性 。 而 这 种 手 
术 通 常 非常 复杂 且 风 险 很 高 。 虽 然 看 起 来 越 早 查 出 肺癌 对 患者 越 好 ,但 是 有 些 研 
究 人 员 认 为 要 慎重 对 待 肿瘤 ， 因 为 肿瘤 通常 并 不 致命 。 “排查 ”通常 是 指 对 一 群 
没有 明显 症状 但 却 有 高 风险 的 人 群 进行 医学 检查 ， 比 如 对 吸烟 者 进行 肺癌 的 排 
查 。“ 通 过 排查 在 早期 就 检测 出 肺癌 是 否 更 有 利 ” 这 个 话题 在 医学 界 是 一 场 旷 日 
持久 的 论战 。 对 于 其 他 癌症 的 排除 ， 如 乳腺 X 光 片 、 子 宫颈 抹 片 检查 、 前 列 腺 特 
异性 抗原 检查 等 ， 也 有 类 似 的 顾虑 。 总 之 ， 排 查 会 使 得 假 阳 性 比率 相对 更 高 ， 因 
此 在 决定 是 否 要 进行 早期 检测 时 需要 进行 权衡 。 

对 于 病 患 和 健康 的 人 来 说 医疗 检查 的 准确 率 也 许 是 不 一 样 的 。 举 一 个 简单 的 
例子 ， 当 你 用 发 烧 这 个 标准 来 诊断 麻疹 。 患 有 麻疹 的 人 几乎 都 会 发 懂 ， 所 以 此 时 
的 准确 率 是 100% 。 但 是 对 于 那些 没有 得 麻疹 却 因为 其 他 原因 发 烧 的 人 来 说 这 种 
方法 根本 就 没有 用 。 许 多 没有 得 麻疹 的 人 被 诊断 患 有 麻疹 ， 所 以 这 个 方法 对 于 那 
些 被 疾病 折磨 的 人 来 说 可 行 度 大 大 降低 。 

病人 被 检查 出 阳性 的 概率 叫做 检查 的 灵敏 度 。 灵 人 敏 度 就 是 衡量 一 个 检查 在 检 
测 疾病 时 有 多 灵敏 。 因 此 ， 发 烧 检 查 对 于 麻疹 来 说 有 很 高 的 灵敏 度 ， 即 假 明 性 很 
少 (很 少 有 得 了 麻疹 却 没有 检查 出 来 的 病例 )。 健 康 的 人 被 检查 出 阴性 的 概率 叫 
做 检查 的 特异 性 。 特 异性 衡量 对 于 特定 疾病 或 条 件 来 说 某 一 种 检查 方法 是 否 足 够 
准确 和 特殊 。 对 于 麻疹 来 说 发 烧 检 查 方法 并 不 特殊 ， 所 以 这 个 方法 的 特异 性 很 
低 ， 会 导致 很 多 假 阳性 的 情况 〈 有 些 人 发 烧 并 不 是 因为 麻疹 引起 的 ) 。 

我 个 人 对 于 假 阳 性 也 是 颇 有 经 历 。 当 我 申请 绿卡 时 ， 我 必须 要 做 一 个 肺结核 
的 皮肤 反应 测验 。 测 验 结果 是 阳性 的 。 对 于 来 自 某 些 国家 的 人 来 说 这 是 常态 ， 因 
为 这 些 国 家 通常 要 接种 很 多 疫苗 ， 针 对 肺结核 接种 的 是 卡介苗 〈 在 我 小 时 候 ， 在 
瑞典 这 个 疫苗 是 必须 接种 的 ， 但 是 现在 可 以 选择 是 否 接种 ) 。 因 此 这 些 疫苗 让 皮 
肤 反应 测验 的 特异 性 降低 了 。 当 皮肤 反应 测验 的 结果 是 阳性 时 ， 我 接着 再 去 做 一 
个 胸 透 。 胸 透 的 结果 排除 了 我 患 有 肺结核 的 可 能 ， 我 终于 拿 到 绿卡 了 。 通 常 来 说 
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第 一 个 检查 的 灵敏 度 都 会 很 高 ， 但 是 特异 性 就 比较 低 ; 那些 被 检测 出 是 阳性 的 人 
会 用 其 他 更 加 特殊 的 方法 进一步 检查 。 在 艾滋 病 病 毒 检测 时 第 一 步 都 会 先进 行 酶 
免疫 检测 或 酶 联 免疫 吸附 检测 。 艾 滋 病 抗体 会 在 这 些 检 测 中 发 生 反应 但 其 他 抗体 
也 会 发 生 反 应 ， 这 样 就 会 产生 假 阳性 的 情况 。 接 下 来 就 会 进行 第 二 步 的 试验 ， 如 
免疫 印迹 法 ， 这 样 就 可 以 将 艾滋 病 抗 体 与 其 他 抗体 区 分 开 了 。 因 此 免疫 印迹 法 比 
酶 免疫 检测 和 酶 联 免疫 吸附 检测 的 特异 性 更 高 ， 但 是 费用 也 相对 更 高 ， 所 以 通常 
不 会 用 来 作为 初步 检测 。 





4.4 贝 叶 斯 法 则 与 案情 分 析 











在 庭审 中 ， 评 估 指 控 被 告 的 证 据 也 可 以 采用 贝 叶 斯 法 则 。 这 和 我 们 上 一 节 提 
到 的 药物 试验 相似 ， 只 需要 把 “检测 呈 阳 性 ”替换 成 “指控 证 据 "，“ 有 病 的 ” 
替换 成 “有 罪 的 ”。 证 据 的 来 源 多 种 多 样 ， 如 目击 者 证 词 、 测 谎 仪 〈 如 果 人 允许 的 
话 ) 、 指 纹 、 脚 印 和 DNA 样本 。 或 者 ， 如 在 1.5 节 中 萨 利 案 中 出 现 的 ， 仅 仅 专家 
声称 两 个 孩子 根本 不 可 能 自然 死亡 的 话 也 可 以 作为 证 据 。 

在 法 庭 中 利用 概率 并 不 是 什么 奇 思 妙 想 。 第 1 章 中 提 到 的 伟大 法 国 数学 家 拉 
普 拉 斯 早 就 想 过 这 个 问题 。 在 1814 年 《关于 概率 的 哲学 讨论 》 一 书 中 ， 他 描述 
了 如 何在 庭审 中 运用 贝 叶 斯 法 则 ( 贝 叶 斯 法 则 在 当时 并 没有 被 人 所 知 ， 拉 普 拉 斯 
自己 独立 发 现 的 ) 评估 证 据 。9 

无 论 是 何 种 证 据 ， 基 本 的 问题 是 被 告 的 罪行 是 否 “ 排 除 合理 怀疑 "。 在 我 们 
的 术语 里 , 已 有 的 证 据 可 以 作为 被 告 有 某 种 犯罪 行为 的 前 提 ， 但 是 否 足够 充分 证 
明 被 告 有 罪 ? 虽然 没有 规则 可 以 定义 哪 一 种 程度 是 足够 高 的 概率 ， 但 我 们 多 半 会 
同意 在 像 谋杀 案 、 强 奸 案 等 严重 的 犯罪 应 当 比 人 店 行窃 案 要 求 的 概率 高 。 显 然 罪 
名 对 应 的 处 罚 越 严厉 就 越 要 确保 被 定罪 的 是 真正 的 罪犯 。 当 然 这 也 导致 了 一 个 意 
外 的 后 果 ， 即 比 起 入 店 行窃 ， 强 奸 和 谋杀 更 容易 脱 罪 。 

那么 庭审 和 药物 试验 就 存在 着 本 质 的 区 别 。 正 如 我 之 前 所 言 ， 在 医学 检查 中 













































































名” 拉 普 拉 斯 在 数学 上 的 天 赋 并 没有 总 是 给 他 带 来 好 运 。 拿 破 仑 任命 其 为 内 政 部 长 ， 但 六 个 月 之 后 他 
就 被 开除 了 。 所 有 的 人 都 抱怨 他 四 处 找茬 ， 给 政府 找 了 许多 鸡毛 蒜 皮 的 小 事 。 还 有 一 个 有 趣 的 
事 ， 拉 普 拉 斯 在 拿破仑 16 岁 的 时 候 还 当 过 他 的 老师 ， 并 且 让 他 通过 了 考试 。 
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最 重要 的 是 减少 假 阴 性 比率 。 而 在 法 庭 上 ， 避 免 判 决 无 境 者 有 罪 比 避 免 宣 布 某 人 
无 罪 更 为 重要 ， 即 避免 假 阳 性 比 避 免 假 阴性 更 重要 。 但 两 者 也 存在 相似 的 问题 : 
忽视 基本 比率 和 混淆 前 后 向 条 件 概率 。 让 我 们 先 从 Kahneman 和 Tversky 提供 的 目 
击 者 报告 示例 开始 吧 。 

全 市 的 出 租车 中 85% 是 蓝 色 的 ， 剩 下 15% 是 绿色 的 。 在 一 起 晚上 发 生 的 交 
通 秘 事 逃 选 案 中 ， 目 击 者 确认 泼 事 出 租车 是 绿色 的 。 实 验证 明 目 击 者 在 正常 日 光 
条 件 下 正确 分 辨 绿色 和 蓝 色 (正确 地 将 绿色 归 为 绿色 ， 蓝 色 归 为 蓝 色 ) 的 概率 
是 80%。 那 么 後 事 出 租车 是 绿色 的 概率 是 多 少 昵 ? 

Kahneman 和 Tversky 在 他 们 的 研究 报告 中 写 道 ， 大 部 分 人 对 这 个 问题 的 回答 
是 80% 。 听 上 去 貌似 合理 ， 因 为 目击 者 平时 的 正确 率 是 80% ， 在 这 个 具体 的 情 
形 中 也 不 会 例外 。 但 这 种 想法 并 没有 考虑 本 城中 出 租车 的 绿 蓝 比 例 。 和 4. 3 节 中 
的 疾病 排查 测试 相同 ， 关 于 出 租车 的 颜色 有 两 类 证 据 : 一 是 基本 比率 ， 另 一 是 目 
击 者 报告 。 根 据 基 本 比率 就 会 认为 後 事 出 租车 为 蓝 色 是 因为 蓝 色 出 租车 更 常见 ， 
而 目击 者 报告 指向 绿色 。 与 往常 一 样 ， 我 们 继续 求助 于 贝 叶 斯 大 师 。 

令 看 到 的 出 租车 是 绿色 的 事件 为 G6， 看 到 的 出 租车 是 蓝 色 的 事件 为 B， 目击 
者 指认 出 租车 是 绿色 的 事件 为 E。 我 们 需要 知道 的 是 条 件 概 率 P(G | 下) 。 如 果 千 
事 车 辆 事实 上 是 绿色 的 ， 那么 目击 者 指认 绿色 的 概率 为 80%。 即 P(E|G) = 
0.8, P(E|1B) =0.2, 基本 比率 为 P(G) =0.15, P(B) =0.85。 现 在 你 知道 如 何 
应 用 贝 叶 斯 法 则 : 





























四 P(E|G)xP(G) 
PCE) “P(E|G)xP(G) +P(E|B)xP(B) 


_ 0. 80 x0. 15 _ 
“0. 80 x0. 15 +0.20x0. 85 


後 事 车 辆 为 绿色 的 概率 是 41%。 所 以 即便 有 目击 者 证 明 ， 出 租车 仍然 更 有 可 能 
是 蓝 色 的 ， 只 不 过 概率 从 最 初 的 85% 跌 到 59% 。 忽 视 基本 比率 就 会 导致 混淆 相 
关 的 条 件 概 率 P(G |E) 和 P(E|G)。 这 也 是 为 什么 不 懂 概 率 知识 的 人 或 者 没有 事 
先 接触 过 概率 的 人 会 犯错 误 。 当 然 还 是 有 人 与 Kahneman 和 Tversky 唱 反 调 ， 认 为 
基本 比率 在 此 类 事件 中 是 无 关 的 。 考 虑 下 面 这 种 情况 ， 你 就 知道 Kahneman 和 
Tversky 的 观点 是 对 的 。 假 设 我 们 查 到 绿色 出 租车 的 公司 在 事故 发 生 时 因 故 将 所 
有 车 辆 都 派 往 邻 市 。 所 以 当时 全 市 的 出 租车 就 都 是 蓝 色 的 。 虽 然 目 击 者 作证 出 租 





0. 41 
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车 是 绿色 的 而 且 有 80% 的 准确 率 ， 你 还 是 能 100% 确认 蓝 色 出 租车 公司 应 该 支付 
赔偿 。 因 此 ， 基 本 比率 不 能 被 忽视 。 

当 基 本 比率 和 目击 者 报告 的 观点 不 同时 ， 常 常 就 会 发 生 此 类 问题 。 当 基本 比 
率 恰恰 相反 时 人 们 的 证 言 会 变 得 非常 有 趣 。 假 设 一 种 极端 的 情况 ，99% 的 出 租车 
是 绿色 ， 目 击 者 指认 绿色 的 概率 是 80% ， 我 想 多 数 人 内 心 超过 80% 的 程度 认为 
绿色 出 租车 公司 应 当 承 担 责任 。 你 可 能 想 运用 贝 叶 斯 规则 来 计算 一 下 ， 那 么 你 得 
到 出 租车 为 绿色 的 概率 为 99.75% 。 值 得 注意 的 是 ， 它 并 不 在 80% 和 99% 之 间 ， 
反而 高 于 这 个 区 间 。 绿 色 出 租车 有 责 的 初始 概率 是 99% ， 仅 仅 基 于 基本 比率 ， 
目击 者 报告 支持 了 这 一 点 ， 所 以 更 新 后 的 概率 就 高 于 99% 。 

出 租车 的 例子 反映 了 一 个 普遍 的 问题 。 无 论 有 什么 证 据 ， 被 告 真正 有 罪 的 概 
率 是 多 少 呢 ? 回想 一 下 1.7 节 中 讲 的 二 手 车 经 销 商 ,假设 你 的 车 发 生 了 令 你 害怕 
的 某 种 发 动机 问题 ， 你 是 否 会 将 车 辆 退回 并 且 控 诉 经 销 商 不 道德 的 商业 行为 ? 你 
多 半 会 是 出 于 无 奈 而 这 样 做 ,不 是 基于 证 据 采 取 这 样 的 行为 。 发 动机 有 问题 的 车 
被 洪水 泡 过 之 后 损坏 的 概率 是 0. 8 x0.05/0.135 二 0.3。 因 此 ， 经销 商 更 可 能 是 无 
就 的 。 

就 真实 的 案件 而 言 ， 让 我 们 重新 回 到 萨 利 案 。 因 为 专家 证 人 认为 ， 在 同一 家 
庭 中 发 生 两 起 婴儿 鸳 死 的 概率 仅 为 730 亿 分 之 一 ， 这 似乎 是 唯一 指控 她 的 “证 
据 ” ， 但 她 被 判 犯 有 谋杀 罪 。 这 个 数据 的 首要 问题 是 它 建立 在 两 个 事件 独立 性 之 
上 ， 这 是 完全 不 切实 际 的 。 我 们 通过 计算 发 现 概 率 应 为 1/ 850000。 让 我 们 将 其 
四 售 五 人 为 百 万 分 之 一 ， 但 这 又 有 什么 意义 呢 ? 这 说 明 像 萨 利 这 样 的 家 庭 ， 两 个 
婴儿 都 独 死 的 概率 是 百 万 分 之 一 ， 概 率 并 不 高 。 但 是 任何 同时 发 生 的 婴儿 独 死 都 
很 罕见 ， 不 论 原 因 如 何 ， 萨 利 一 家 发 生 了 不 同 寻 常 的 事 。 鉴 于 这 件 事 已 经 发 生 
了 ， 需 要 知道 婴儿 自然 独 死 而 萨 利 无 罪 的 概率 是 多 大 。 

让 我 们 再 次 运用 贝 叶 斯 法 则 。 假设 两 起 都 是 婴儿 独 死 的 事件 为 C， 两 起 都 是 
谋杀 的 事件 为 M。 为 简单 起 见 ， 排 除 一 起 为 谋杀 和 男 一 起 为 婴儿 狸 死 的 情况 。 由 
于 不 可 能 有 其 他 的 死亡 情况 ， 所 以 两 起 死亡 只 能 被 写作 C 或 者 M。 已 知 P(C) = 
1/1000000， 相 关 概 率 即 萨 利 无 罪 的 条 件 概率 是 P(C | (C 或 MM) ) ， 相 反 的 条 件 概 
率 P((C 或 W) 10) 显然 等 于 1 ( 若 观 测 到 C， 则 “C 或 M” 就 是 必然 的 )。 贝 叶 
斯 法 则 描述 的 萨 利 无 罪 概率 如 下 : 
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_P((C 或 M) |C)xP(C)  P(C) 
P(C1(C 或 MM))= P(C 或 1) = pCC) + POM) 


其 中 ， 分 母 运算 还 使 用 了 第 1 章 提 到 的 加 法 法 则 。 但 因为 我 们 不 知道 P(M) 是 多 
少 ， 现 在 还 无 法 计算 下 去 。P(M) 是 指 像 萨 利 这 样 的 家 庭 中 母亲 谋杀 两 个 婴儿 的 
概率 。 无 论 如 何 ， 这 个 数值 肯定 是 非常 小 的 ， 毫 无 疑问 肯定 低 于 两 起 都 是 婴儿 狂 
死 的 概率 。 大 多 数 母亲 都 不 会 杀害 她 们 的 孩子 ， 所 以 P(M) 非 常 接近 于 0。 为 
了 便于 讨论 ， 我们 可 以 先 假设 双重 谋杀 和 双重 独 死 同样 可 能 ， 即 P(M) = 
1/1000000。 代 入 上 述 公式 中 ， 有 





| 1/1000000 
P(C1(C 或 M)) =171000000+171000000=172 


萨 利 无 罪 的 可 能 性 是 50% ， 这 个 结果 听 上 去 比较 合理 。 因 为 针对 此 案 发 生 的 是 
极为 罕见 的 事 ， 两 种 解释 具有 同样 的 可 能 性 。 仪 仪 因为 婴儿 同时 独 死 的 情形 极为 
罕见 就 说 萨 利 杀害 了 她 的 孩子 们 是 错误 的 ， 这 显然 没有 考虑 到 双重 谋杀 的 情况 也 
同样 军 见 。 

如 果 730 亿 分 之 一 可 以 作为 证 据 指 控 萨 利 ， 那 么 3. 1 节 中 介绍 的 亚当 斯 连续 
中 乐 透 大 奖 和 她 的 17 万 亿 分 之 一 概率 的 结论 又 是 什么 ? 不 可 能 发 生 吗 ? 但 它 确 
实 发 生 了 。 在 萨 利 案 中 ,不 仅 婴 儿 同 时 狸 死 不 太 可 能 ,任何 两 起 死亡 都 不 太 可 
能 。 一 旦 这 件 不 太 可 能 的 事件 发 生 了 ， 我 们 就 需要 基于 罕见 事件 的 条 件 概 率 评 估 
所 有 可 能 的 解释 。 不 能 因为 另 一 种 解释 似乎 不 可 信 就 在 一 开始 排除 了 它 的 可 能 
性 ， 不 依 此 作为 判 案 的 依据 。 即 使 福尔摩斯 也 在 庭 上 ， 他 也 肯定 会 反对 专家 证 人 
和 他 的 730 亿 分 之 一 : 

你 不 会 听 我 的 话 的 ， 他 摇 着 头 说 。 我 曾 多 次 对 你 说 过 ， 一 旦 排除 所 有 的 不 可 
能 ， 无 论 剩 下 的 可 能 多 么 不 可 思议 ， 它 就 是 真相 。 
阿 瑟 柯 南 道 尔 串 士 ,《 四 签名 》，1890 

在 萨 利 这 样 的 家 庭 中 连续 两 次 杀害 婴儿 当然 是 非常 罕见 的 ， 我 确定 发 生 的 概 
率 远 低 于 同时 发 生 婴 儿 狂 死 案 。 假 设 概率 是 千 万 分 之 一 ， 萨 利 有 罪 的 条 件 概 率 则 
是 1Z11 或 约 9%。 顺便 说 一 下 ， 上 述 使 用 的 “婴儿 独 死 ”和 “自然 死亡 ”是 同 
义 。 但 这 并 不 完全 准确 ， 婴 儿 独 死 仅 是 自然 死亡 的 情况 之 一 ， 这 也 是 对 萨 利 有 利 
的 另 一 个 事实 。 

在 萨 利 案 中 ,证 据 并 非 针 对 于 她 。 然 而 在 多 数 案件 中 ,证 据 都 是 针对 特定 被 
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告 的 。 目 击 者 报告 、 指 纹 、 脚 印 或 DNA 样本 都 可 能 与 被 告 匹 配 。 就 现代 法 律 经 
典 案件 而 言 ， 我 们 可 以 想 想 加 利 福 尼 亚 州 的 公民 诉 柯 林 斯 案 。1964 年 6 月 18 日 ， 
胡 安 妮 塔 . 布鲁克 斯 在 洛杉矶 的 街头 遇 到 抢 动 。 一 名 目击 者 声称 看 到 扎 马 尾 的 金 
发 女子 从 现场 逃离 ， 并 坐 上 了 一 名 留 着 山羊 胡 和 小 胡子 的 黑人 男子 驾 怠 的 黄色 汽 
车 离开 。 警 察 随后 根据 此 描述 隶 捕 了 珍妮 特 和 麦 尔 考 姆 . 柯林斯 。 在 法 庭 上 ， 布 
鲁 克 斯 小 姐 和 目击 证 人 都 不 能 辨认 出 任何 一 个 被 告 是 犯罪 分 子 ， 而 且 也 没有 其 他 
证 据 可 以 指控 柯林斯 。 为 了 推动 案件 ， 控 方 传唤 了 一 位 本 地 的 数学 老师 作证 。 这 
为 数学 老师 利用 概率 知识 来 证 明 一 对 随机 选取 的 夫妇 拥有 以 上 全 部 特征 (棕色 ， 
山羊 胡 、 黄 色 汽 车 等 ) 的 概率 只 有 一 千 二 百 万 分 之 一 。 他 得 到 数据 的 来 源 是 赋予 
六 个 个 人 特征 不 同 的 概率 : 

P( 留 山羊 胡 的 男子 ) =1/4 

已 ( 留 小 胡子 的 黑人 男子 ) =1/10 

P( 扎 马尾 的 女子 ) =1/10 

P( 金 发 女子 ) =1/3 

P( 混 合 人 种 夫妻 ) =1/1000 

P( 黄 色 汽 车 ) =1/10 
之 后 相 乘 得 到 1/12000000 的 概率 。 控 方 赁 此 提出 柯林斯 无 罪 的 概率 仅 为 一 千 二 
百 万 分 之 一 。 被 告 因此 被 定罪 。 

1968 年 ， 被 告 上 诉 至 加 利 福 尼 亚 最 高 法 院 , 希望 基于 四 点 理由 推翻 判决 ， 

其 中 三 点 都 和 一 千 二 百 万 分 之 一 这 个 概率 的 计算 有 关 : 依据 的 个 体 特征 概率 并 无 
事实 根据 ; 个 体 特征 事件 间 的 独立 性 假设 不 成 立 ( 比如 小 胡子 和 山羊 胡 之 间 的 独 
立 性 ) 以 及 忽视 目击 者 报告 发 生 错 误 的 可 能 性 (包括 错 认 胡子 和 染发 的 可 能 性 
等 ) 。 第 四 点 最 为 关键 : 将 观察 到 特征 的 概率 与 无 罪 的 概率 等 同 起 来 是 荒 雇 的 。 
即使 前 三 个 问题 不 存在 ， 也 只 能 说 明 一 对 随机 选取 的 夫妇 符合 上 述 特征 的 概率 为 
一 千 二 百 万 分 之 一 ， 而 成 千 上 万 的 夫妇 都 可 能 在 当时 出 现在 犯罪 现场 。 你 也 知 
道 ， 如 果 n 足够 大 ， 即 使 p 小 到 1712000000， 也 不 足以 排除 某 种 可 能 性 。 本 案 
中 ， 基 于 已 有 证 据 证 明 另 一 对 符合 上 述 特征 的 夫妇 有 罪 也 并 非 完全 不 可 能 。 实 际 
上 ， 如 果 我 们 确认 另 有 一 对 符合 特征 的 夫妇 存在 的 话 ， 柯 林 斯 夫妇 有 罪 的 概率 就 
会 降 到 50% ， 不 足以 定罪 。 而 如 果 确 认 另 有 两 对 夫妇 存在 的 话 ， 有 罪 率 又 会 进 
一 步 降 到 1/3， 以 此 类 推 。 
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让 我 们 将 柯林斯 夫妇 的 例子 放 在 一 边 ， 在 大 环境 中 重新 考虑 他 们 的 处 境 。 假 
设 某 些 人 (或 者 夫妇 、 团 体 、 企 业 等 ) 因为 单一 证 据 面临 指控 ， 已 知 该 项 证 据 
符合 随机 选取 个 人 的 概率 为 p»， 若 证 据 与 被 告 符合 ， 有 罪 概 率 是 多 大 ? 

这 个 问题 显然 又 是 一 个 贝 叶 斯 法 则 的 示例 。 用 G 和 了 分 别 代 表 有 罪 和 无 罪 ， 
巨 代 表 证 据 。 若 被 告 有 罪 ， 则 必然 与 证 据 相 符 ; 若 无 罪 ， 仍 然 有 可 能 与 证 据 相 
符 ， 概 率 为 p。 那 么 条 件 概率 P(E|G) =1, P(E |7) =p。 就 证 据 而 言 ， 被 告 有 罪 
的 概率 如 下 : 





























P(E|G)xP(G) 
P(CC | 五) “P(E|G)xP(G) +P(E|I)xP(D) 


四 P(G) 
PCC) +pxPOD 


没有 初始 概率 ， 就 没 办 法 继续 算 下 去 。 假 设 除了 被 告 ， 有 个 嫌犯 被 认为 同样 可 
能 有 罪 。 那 么 可 能 的 嫌犯 总 共 就 有 n+1 个 ， 任 何 一 人 有 罪 的 可 能 性 是 P(C) = 
1/(n+1),P(1) =1-P(C) =n/(n+1)。 代 入 上 式 得 出 有 罪 概 率 : 


1 
1 +n xp 


这 个 问题 常 被 描述 为 在 岛 上 有 n+1 个 人 ， 其 中 一 人 是 凶手 ,而 男 一 人 恰巧 与 犯 
罪 现 场 的 DNA 匹配 。 这 个 所 谓 的 “岛屿 问题 ”早已 在 律师 和 概率 学 家 中 引发 争 
论 〈 猜 猜 谁 最 可 能 回答 正确 ) 。 

在 柯林斯 案 中 ，p 等 于 1/12000000， 而 n 可 大 至 百 万 。 假 设 n 是 两 百 万 ， 以 
上 公式 可 得 出 有 罪 概率 为 86% ， 在 其 他 证 据 欠 和 缺 的 情形 下 并 不 足以 定罪 。 无 论 
如 何 ，14% 和 1200 万 分 之 一 的 无 罪 率 之 间 是 天 壤 之 别 。 在 法 律 语 境 中 ， 
P(E|7) 与 P(11E) 的 混淆 被 称 做 检察 官 雇 误 。 有 一 些 案件 中 出 现 的 概率 可 能 比 
柯林斯 案 的 千 百 万 之 一 小 ， 但 同样 也 能 表现 出 雇 误 的 荡 唐 。 举 一 个 例子 ， 某 项 犯 
罪 是 由 AB 血型 罪犯 所 为 ， 已 知 美国 人 口中 AB 型 出 现 概 率 为 4% 。 若 被 告 为 AB 
型 ， 控 方 的 雇 误 就 会 是 基于 该 项 证 据 主 张 被 告 有 罪 率 达到 96% 。 这 当然 非常 可 
笑 ， 因 为 4% 指 的 是 近 1200 万 美国 人 有 该 血型 的 概率 ， 他 们 都 有 96% 的 可 能 性 
犯罪 。 

贝 叶 斯 法 则 在 测 谎 试验 中 很 有 效 。 首 先 指 出 测 谎 仪 并 不 是 检测 谎言 的 。 我 们 
已 经 知道 这 个 观点 了 。 但 因为 我 们 认为 它 的 功能 如 此 ， 我 们 还 是 将 其 称 之 为 测 谎 
仪 。 测 谎 仪 的 准确 性 一 直 饱 受 争论 ， 甚 至 有 专门 支持 和 反对 的 网 站 。 我 曾 看 过 一 
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个 网 站 欣然 宣称 “ 别 担 心 ， 测 谎 仪 可 以 轻易 被 打败 ”。 

不 论 测 谎 仪 的 真相 是 什么 ， 它 和 其 他 类 型 证 据 在 评估 中 都 存在 同样 的 问题 : 
忽视 基本 比率 和 误 报 。 假 设 测 谎 仪 准确 分 辩 真 伪 的 概率 为 95% ， 你 用 来 测试 你 
诚实 的 朋友 是 否 会 说 谎 ， 出 乎 意料 地 得 到 肯定 回答 。 你 起 初 预计 他 撒谎 的 概率 为 
千 分 之 一 。 那 么 真实 的 撒谎 率 是 多 少 呢 ? 令 朋 友 撒 谎 的 事件 为 L， 说 出 真相 的 事 
件 为 了 ，+ 代 表 指 数 为 正 ， 相 关 概 率 为 P(L | + )， 运 用 贝 叶 斯 法 则 : 


_ P(+ |L)xP(L) 
DUD tg TY + | Tot 


0.95 x0. 001 
0.95 x0.001 +0.05 x0.999 


这 位 令 人 尊敬 的 朋友 说 谎 的 可 能 性 还 是 很 小 的 。 正 如 我 们 之 前 所 研究 的 许多 示 
例 ， 当 你 采用 不 完善 的 测试 流程 对 罕见 之 事 进 行 测试 时 ， 得 到 正 值 的 概率 会 被 
放大 。 

最 有 趣 的 概率 问题 发 生 在 DNA 证 据 领域 。1994 年 ， 前 橄榄 球 运动 员 辛 普 森 
面临 谋杀 指控 。 你 肯定 听 说 过 了 .9 在 庭审 中 ， 专 家 证 人 作证 称 犯 罪 现 场 发 现 的 
血迹 来 自 辛 普 森 以 外 的 人 的 概率 为 1.7 亿 分 之 一 。 这 个 数字 是 怎么 得 来 的 呢 ? 当 
然 不 是 源 于 仔细 检查 了 吉 括 1.7 亿 人 口 样本 的 DNA 数据 库 ， 而 是 与 柯林斯 案 中 
那 位 数学 老师 的 做 法 相似 。 在 小 规模 人 群 中 收集 具有 独立 性 的 染色 体 上 的 基因 作 
数据 。 以 血型 为 例 ,根据 “AB0O 分 类 法 ”， 四 种 血型 分 别 是 A，B，AB 和 0 型 。 
你 的 血型 取决 于 一 条 染色 体 上 某 个 特定 的 基因 。 此 外 ， 血 型 还 根据 Rh 因子 呈 阳 
性 或 阴性 而 分 类 ， 这 取决 于 另 一 条 染色 体 上 的 基因 ， 和 ABO 血型 无 关 。 假 设 
40% 的 美国 人 口 是 A 型 血 ， 其 中 16% 是 Rh 阴性 。 因 为 具有 独立 性 ， 我 们 可 以 得 
知 是 40% 中 的 16% ， 即 6.4% 的 人 口 是 A 型 Rh 阴性 血 。 

和 “DNA 指纹 ”相近 ， 许 多 基因 座 就 被 用 于 研究 基因 排列 组 合 的 频率 ， 通 
过 将 频率 相 乘 计 算出 随机 匹配 的 概率 。 这 样 就 可 通过 相关 的 小 额 样本 (但 也 不 能 
太 小 ， 以 至 忽略 了 个 体 间 的 自然 差异 性 ) 计算 出 概率 了 。 在 辛普森 案 中 ，1.7 亿 
分 之 一 的 数据 就 是 根据 240 名 底特律 非 毅 美国 人 样本 计算 出 来 的 。 如 果 概 率 计 算 
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”该 犯罪 的 发 生地 恰巧 距离 柯林斯 案 的 犯罪 现场 仅 数 英 里 ， 而 时 间 也 恰好 是 30 年 后 的 同一 天 ， 即 
1994 年 6 月 18 日 ， 这 样 的 概率 又 是 多 少 呢 ? 


























生活 中 的 概率 趣事 


所 使 用 的 DNA 样本 来 源 于 米 勒 斯 堡 的 阿 米 什 人 、 俄 交 俄 州 、 拉 斐 特 的 卡 津 人 或 
者 路 易 斯 安 那州 ， 那 可 能 就 不 太 有 用 了 。1.7 亿 分 之 一 非常 引 人 和 人 注目， 但 因为 
DNA 证 据 已 被 警方 污染 ， 且 检 方 承认 在 概率 计算 中 发 生 了 某 些 错误 。 总 而 言 之 ， 
对 于 未 受过 训练 的 人 来 说 DNA 证 据 的 概率 论 本 质 确实 难以 把 握 ， 一 位 陪审 员 在 
庭审 后 表示 “我 对 DNA 这 种 东西 完全 不 能 理解 ”"， 他 又 接着 说 道 “ 我 希望 法 庭 
上 能 有 一 位 概率 学 家 进行 解释 ， 帮 助 我 在 判断 的 过 程 中 更 好 地 理解 和 应 用 DNA 
证 据 "， 要 是 这 样 该 有 多 好 ! 而 他 事实 上 说 的 是 “对 我 来 说 这 完全 是 浪费 时 间 ， 
它 那么 遥 不 可 及 ， 于 我 也 没有 任何 意义 ”。 

概率 学 家 出 庭 的 先例 并 非 没 有 。 在 1996 年 英国 里 页 纳 诉 亚 当 斯 强奸 案 中 ， 
牛津 教授 彼得 . 多 纳 利 对 陪审 团 的 辅导 内 容 就 是 贝 叶 斯 法 则 及 其 在 评 佑 证据 方面 
的 应 用 。 该 案 中 ， 指 控 被 告 的 唯一 证 据 也 是 DNA 的 匹配 度 ， 概 率 低 至 2 亿 分 之 
一 。 被 告 有 许多 有 利 的 证 据 ， 包 括 女 友 做 的 不 在 场 证 明和 强奸 受害 人 的 指认 失 
败 。 多 纳 利 先生 向 陪审 团 解释 他 们 该 怎样 运用 概率 计算 和 贝 叶 斯 法 则 算出 最 终 的 
有 罪 概 率 (对 于 不 同 的 陪审 团 成 员 ， 数值 可 能 是 不 同 的 )。 我 不 打算 详细 介绍 案 
件 细节 ,但 最 终 亚当 斯 一 审 被 判 有 罪 , 案件 上 诉 后 上 诉 法 院 维持 了 原 判 。 彼 
得 . 多 纳 利 2005 年 发 表 在 《重要 性 》 淋 志 上 的 文章 对 该 案 进 行 了 详细 介绍 。 

在 和 概率 极 低 的 DNA 证 据 打交道 时 ， 最 重要 的 是 明确 概率 适用 的 是 全 部 人 
口 (或 考虑 中 的 特定 人 群 )。 因 此 ， 随 机 抽取 的 个 体 与 DNA 相 匹 配 的 概率 可 能 是 
两 亿 分 之 一 , 但 是 你 如 果 检 测 被 告 的 亲属 ， 就 会 发 现 匹 配 的 概率 更 高 。 事 实 上 ， 
如 果 被 告 有 同 卵 的 双胞胎 ， 他 或 她 的 DNA 就 是 一 样 的 9 ， 这 个 就 不 会 纳入 那 
“两 亿 分 之 一 ” 。 兄 弟 姐 妹 、 父 母 、 答 兄弟 姐妹 、 姑 姨 、 叔 伯 在 基因 上 比 随 机 选 
取 的 人 更 接近 ， 与 被 告 DNA 相 匹 配 的 概率 也 更 高 。 在 贾 纳 诉 亚 当 斯 强奸 案 中 ， 
被 告 同 父 异 母 或 同 母 异 父 的 兄弟 的 DNA 因 故 未 检测 ， 这 就 构成 了 问题 。 

我 想 我 们 有 目 共 睹 的 是 : 庭 上 的 概率 争论 至 关 重 要 却 也 困难 重重 。 亚 当 斯 案 
上 诉 后 ， 上 诉 法 庭 就 贝 叶 斯 法 则 的 运用 发 表 了 以 下 声明 : 

“我 们 认为 将 此 类 案件 对 概率 证 据 的 依赖 视 为 造成 混淆 和 错误 判断 的 因素 ， 



































































































































”虽然 同 卵 双胞胎 有 相同 的 DNA, 但 DNA 可 以 通过 不 同 的 方式 表达 ， 这 也 是 为 什么 区 分 同 卵 双 胞 
胎 (经 过 某 些 实践 ) 是 可 能 的 。 一 个 可 笑 的 结果 是 ， 如 果 要 区 分 同 卵 双胞胎 的 话 ， 采 用 DNA 指 
纹 比 采用 由 墨水 和 纸张 获取 的 传统 指纹 更 难 。 
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这 些 混淆 和 错误 判断 可 能 发 生 在 律师 中 ,更 可 能 发 生 在 法 官 中 ， 而 在 陪审 团 中 则 
几乎 是 必然 发 生 的 。 

我 反对 这 一 看 法 ， 对 贝 叶 斯 法 则 的 合理 运用 才 是 避免 混淆 和 错误 判断 的 秘 
诀 。 当 然 ， 这 只 是 一 位 谦 进 的 概率 学 家 的 观点 ， 如 果 他 要 参加 庭审 的 话 ， 一 定 会 
要 求 他 的 陪审 团 同 事 们 完全 由 其 他 的 概率 学 家 组 成 。 





























4.5 结语 











在 所 有 的 数学 发 现 中 ， 贝 叶 斯 法 则 大 概 是 运用 最 多 的 法 则 之 一 。 它 从 最 开始 
的 籍 籍 无 名 到 现在 的 广泛 应 用 ， 它 作为 一 个 统计 方法 的 分 支 一 一 贝 叶 斯 统计 的 基 
础 通常 被 运用 在 我 们 本 章 介绍 的 这 些 复杂 的 例子 中 。 这 种 特殊 的 概率 方法 需要 非 
常 复杂 的 计算 ， 直 到 现代 计算 机 的 问世 才 使 得 这 种 计算 变 得 简单 。 本 章 中 我 们 主 
要 介绍 了 贝 叶 斯 法 则 在 “概率 侦探 工作 ”中 的 应 用 ， 从 如 何在 庭审 中 依据 该 规 
则 做 出 判决 到 医学 疾病 诊断 及 其 他 类 似 的 应 用 。 有 趣 之 处 就 在 于 后 向 概率 的 计 
算 : 我 们 知道 结果 但 是 却 不 知道 计算 的 过 程 。 设 定 一 个 特定 的 场景 ,我 们 已 知 了 
结果 却 不 知道 概率 ， 我 们 的 目标 就 是 通过 结果 来 计算 概率 。 而 这 一 目标 只 能 由 贝 
叶 斯 公式 来 实现 。 

































































1. 一 个 朋友 告诉 你 投资 的 基金 
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你 在 期 竺 什么 


张 50% ， 要 么 跌 40% ， 上 涨 和 下 跌 





























[0 果 你 投资 了 1000 美 
































两 年 之 后 这 笔 钱 变 成 多 少 呢 ? 












































2. 为 什么 当 你 








感觉 等 待 的 时 间 特 别 长 ? 








































































































第 5 章 超越 概率 : 你 在 期 待 什么 


5.1 伟大 的 期 望 


在 前 面 几 章 中 我 有 时 会 提 到 “一 般 说 来 ”会 发 生 什么 事情 ， 或 者 存在 随机 
性 的 情况 下 你 “预期 ”发 生 什 么 情况 。 比 如 ,在 3.5 节 中 ， 泊 松 分 布 中 的 参数 
和 表示 所 有 出 现 数 字 的 平均 数 。 我 说 过 平均 每 38 次 轮 盘 上 的 所 有 数字 就 都 会 出 
现 ， 你 每 掷 12 次 货 子 平均 有 2 次 会 出 现 6。 本 章 中 我 们 要 详细 地 讨论 这 个 平均 
数 ， 同 时 我 们 还 要 跳出 概率 之 外 ， 介 绍 被 概率 学 家 们 称 为 “期 望 值 ”的 术语 。 
期 望 值 只 用 一 个 数字 就 将 所 有 的 试验 都 概括 了 。 要 计算 这 个 值 ， 你 需要 知道 所 有 
可 能 出 现 的 情形 以 及 每 种 情形 对 应 的 概率 。 然 后 用 每 一 个 出 现 的 值 乘 以 具体 对 应 
的 概率 ， 得 到 的 数 全 部 相 加 。 让 我 们 来 举 一 个 简单 的 例子 吧 。 

掷 蜗 子 可 能 出 现 的 情形 就 是 1 ~6， 每 一 种 情形 出 现 的 概率 都 是 1/6。 用 我 刚 
才 介 绍 的 方法 可 知 3.5 是 期 望 值 ， 计 算 方法 如 下 : 

lxl1/6+2x1/6+3x1/6+4x1/6+5 x1/6+6x1/6=3.5 

你 也 许 也 注意 到 了 ,“ 期 望 ”一 词 会 让 人 有 些 费 解 ， 因 为 不 管 你 怎么 掷 仍 子 都 不 
可 能 掷 出 3.5。 用 “期 望 平 均 数 ”可 能 会 更 容易 理解 。 比 如 ， 当 你 投 5 次 人 蜗 子 得 
到 的 数字 分 别 是 2，3，1，5 ，3 ， 那 么 平均 数 就 是 (2 +3 +1+5 +3)/5 =2.8。 你 
再 投 5 次 骨 子 得 到 的 数字 分 别 是 2，5，1，4,，5， 这 10 次 的 平均 数 就 是 31/10 = 
3. 1。 你 不 断 地 投 骨 子 ， 然 后 计算 平均 数 ， 最 后 这 个 平均 数 就 不 断 向 3.5 靠拢 。 
在 下 一 章 中 我 会 对 这 个 解释 作出 更 加 详尽 、 准 确 的 前 述 。 你 也 可 以 假想 一 下 掷 
6 次 货 子 ， 每 次 都 是 不 同 的 数字 这 样 一 种 “完美 试验 ”的 情况 。 这 种 情况 下 得 到 
的 平均 数 就 是 3. 5， 这 也 是 投 骨 子 的 期 望 值 。 

在 花旗 骨 游 戏 中 ， 需 要 撕 两 颗 骨 子 然后 再 将 两 者 之 和 相 加 。 那 么 和 的 期 望 值 
是 多 少 呢 ?” 对 于 两 个 骨 子 数字 之 和 来 说 其 取得 的 值 的 范围 为 2~12, 但 是 得 到 每 
个 数字 的 概率 却 是 不 一 样 的 。 比 如 要 得 到 2， 你 需要 连续 两 次 掷 出 1， 这 时 概率 
为 1/36。 而 如 果 需 要 得 到 3， 那 么 需要 一 颗 掷 出 1， 另 一 颗 掷 出 2， 反 之 亦 可 。 
此 时 概率 为 2/36。 两 者 之 和 是 4 可 以 有 三 种 组 合 1-3，2-2，3-1， 所 以 概率 为 
3/36。 接 下 来 的 数字 也 依次 可 以 计算 出 对 应 的 概率 。 数 字 7 对 应 的 概率 最 高 ， 为 
6/36。 而 从 数字 7 之 后 的 数字 对 应 的 概率 又 开始 下 降 ， 一 直到 数字 12 对 应 的 概 
率 只 有 1/36 (如 果 对 于 上 述 计算 结果 不 太 确定 的 话 ， 可 以 参考 图 1-2) 。 现 在 我 












































生活 中 的 概率 趣事 


们 把 所 有 的 数字 对 应 的 概率 相 乘 ， 再 相 加 

2 x1/36 +3 x3/36+…+12 x1/36=7 
得 出 撕 两 个 骨 子 的 期 望 值 是 7。 这 次 的 期 望 值 与 毛 一 颗 骨 子 的 期 望 值 3.5 不 
同 。 但 是 这 也 同样 不 意味 着 你 每 一 次 玩 花 旗 仍 游戏 你 都 会 得 到 7， 这 样 的 话 
可 以 轻易 地 在 赌场 发 财 致 富 了 。7 只 表示 从 长 远 来 看 你 得 到 的 数字 的 平均 数 
是 7。 

找 两 颗 骨 子 点 数 的 期 望 值 正好 是 毛 一 颗 骨 子 点 数 期 望 值 的 两 倍 。 这 并 不 是 什 
么 巧合 。 因 为 期 望 值 具有 可 加 性 。 我 们 完全 没有 必要 进行 上 面 复杂 的 计算 ， 只 需 
要 把 两 个 山 子 的 期 望 值 相 加 ， 即 3.5 +3.5 =7。 这 使 得 计算 期 望 值 非常 的 简便 。 
如 果 你 掷 100 个 货 子 ， 那 么 你 不 需要 辛 藻 地 计算 要 得 到 数字 298 、583 要 怎么 样 
进行 组 合 ， 你 可 以 轻易 地 知道 它们 的 期 望 值 是 350 (如 果 不 嫌 麻烦 的 话 你 大 可 以 
慢 慢 计算 ) 。 

期 望 值 不 仅仅 有 可 加 性 ， 它 们 还 具有 另外 一 个 相对 来 说 更 普遍 的 特征 一 一 线 
性 。 这 就 意味 着 如 果 你 把 每 一 个 结果 都 乘 以 一 个 定量 ， 那 么 新 的 期 望 值 就 是 原来 
的 期 望 值 乘 以 这 个 定量 。 比 如 掷 恕 子 ， 然 后 把 每 次 出 现 的 数字 乘 以 二 。 那 么 这 时 
的 期 望 值 就 是 原来 掷 一 次 禹 子 期 望 值 的 两 倍 ， 即 2 x3.5 =7。 这 时 你 会 发 现 尽管 
两 次 试验 不 一 样 ， 但 搓 一 次 山子 再 乘 以 二 的 期 望 值 和 掷 两 次 山 子 的 期 望 值 是 一 样 
的 。 前 一 种 试验 每 次 出 现 的 数值 都 是 六 个 偶数 2、4、…、12 之 一 ; 而 后 一 种 试 
验 可 能 出 现 十 一 个 不 同 的 数字 2、3、4、…、12。 

为 了 让 读者 们 更 加 深刻 地 理解 线性 这 个 特征 ， 现 在 我 们 通过 用 掷 三 颗 仍 子 得 
到 的 数 来 画 和 矩形 。 第 一 颗 蜗 子 的 数值 决定 一 边 的 长 度 ， 另 外 两 颗 般 子 数 值 之 和 决 
定 另 一 边 的 长 度 ( 原 书 中 作者 并 没有 说 明 单 位 。 在 此 假设 单位 为 em， 以 后 的 数 
据 中 会 省 略 这 一 单位 ) ， 那 么 这 个 矩形 周 长 的 期 望 值 是 多 少 ? 掷 三 个 骨 子 一 共 能 
出 现 216 种 不 同 的 情形 。 其 中 最 小 的 矩形 长 为 2， 宽 为 1， 所 以 周 长 为 6。 因 为 出 
现 这 种 矩形 只 有 一 种 可 能 性 ，(1，1，1)， 概 率 只 有 1/216。 而 最 大 的 矩形 长 为 
12， 宽 为 6， 周 长 为 36。 这 一 种 情况 的 概率 也 为 /216。 在 这 两 种 情况 之 间 存 在 
着 许多 其 他 可 能 的 情况 ， 对 应 着 不 同 的 概率 。 比 如 符合 周 长 是 8 的 要 求 有 三 种 情 
况 : (1, 1, 2)、(1, 2, 1)、(2, 1,，1)， 因 此 其 概率 为 3/216 (这 三 个 矩形 的 
面积 分 别 是 1 x3，1 x3，2 x2) 。 在 计算 这 个 例子 的 期 望 值 时 我 们 不 需要 把 每 一 
种 可 能 性 都 列 出 来 ， 再 分 别 计算 概率 。 因 为 矩形 的 周 长 等 于 两 倍 的 长 加 上 两 倍 的 
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宽 ， 而 在 这 个 例子 中 宽 和 长 对 应 的 期 望 值 就 是 3.5 和 7。 我 们 只 需要 运用 期 望 值 
的 线性 特征 就 可 以 知道 周 长 的 期 望 值 为 2 x3.5 +2 x7 =21。 这 个 例子 就 说 明了 利 
用 线性 这 个 特征 可 以 简化 计算 。 

读者 也 许 注 意 到 了 上 一 个 例子 计算 出 来 的 周 长 期 望 值 正好 是 最 小 矩形 和 
最 大 和 矩 形 周 长 的 中 间 数 。 对 于 1、2、…、6 来 说 中 间 数 是 3.5; 对 于 2、 
3 、… 12 来 说 中 间 数 是 7; 对 于 100 、101、…、600 来 说 中 间 数 是 350。 这 
些 例 子 的 共同 点 是 所 有 的 概率 分 布 都 是 对 称 的 。 如 果 你 搓 一 个 驶 子 ， 那 么 就 
是 从 3.5 这 个 中 间 数 开始 向 两 端 发 展 ， 对 应 数字 对 应 的 概率 也 一 样 ， 即 3 和 
4 的 概率 是 一 样 的 ，2 和 5 的 概率 是 一 样 的 ，1 和 6 的 概率 也 一 样 。 当 然 ， 这 
个 例子 比较 极端 ， 所 有 的 数字 对 应 的 概率 都 是 1/6。 所 以 用 两 个 货 子 的 例子 
更 能 说 明 问题 。7 这 个 中 间 数 对 应 的 概率 是 6/36。6 和 8 对 应 的 概率 是 
5/36, 一 直 计 算 直 到 最 后 两 个 数字 2 和 12 ， 它 们 对 应 的 概率 是 1/36。 在 以 
上 的 例子 中 你 完全 可 以 通过 计算 每 一 种 可 能 出 现 的 情形 的 平均 数 来 计算 期 望 
值 。 如 1、2、…、6 的 平均 数 就 是 3.5 而 2、3 、…、12 的 平均 数 就 是 7。 但 
是 这 种 方法 并 不 适用 于 所 有 计算 期 望 值 的 情形 。 比 如 掷 两 个 蜗 子 ， 记 录 下 大 
的 数字 。 那 么 此 时 对 应 的 期 望 值 是 多 少 呢 ? 

这 个 大 的 数字 可 能 是 1 ~6 中 的 任何 一 个 数字 ， 但 是 每 个 数字 对 应 的 概率 再 
也 不 是 等 可 能 了 ， 概 率 的 分 布 也 不 对 称 。 我 们 大 概 可 以 感知 到 这 个 期 望 值 应 当 比 
3.5 大 。 要 知道 这 种 情况 下 的 期 望 值 我 们 首先 需要 计算 出 每 个 数字 对 应 的 概率 。 
记录 下 的 数字 是 1 的 时 候 只 有 一 种 情况 ， 就 是 两 颗 仍 子 都 掷 出 了 1 点 ， 此 时 概率 
为 1/36。 当 较 大 的 数字 是 2 时 存在 三 种 可 能 情况 : 1-2，2-1 和 2-2， 概 率 为 
3/36。 按 照 这 样 的 方法 计算 ， 当 较 大 值 是 6 时 对 应 有 11 种 可 能 的 情形 ， 因 此 概 
率 为 11/36 (为 了 计算 方便 ， 读 者 可 以 参照 图 1-2) 。 如 果 想 要 用 数学 公式 来 表示 的 
话 , 令 较 大 的 数 为 &， 则 对 应 的 概率 为 (2 xk -1)/36， 其 中 的 值 为 1~6 的 整 
数 。 那 么 四 舍 五 人 到 小 数 点 后 第 一 位 ， 期 望 值 为 

1 x1/36 +2 x3/36 +… +6 x11/36=~4.5 

读者 可 以 自己 来 证 明 较 小 数 的 期 望 值 约 等 于 2.5 (无 需 计算 也 能 看 出 
来 吗 ?) 。 

证 我 们 再 举 一 个 非 对 称 概 率 的 例子 ， 这 个 例子 中 包含 了 负数 。 你 在 玩 轮 盘 ， 
在 数字 29 上 押 了 1 美元 。 那 么 你 的 期 望 收 入 是 多 少 ? 一 共有 两 种 可 能 性 : 以 
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1Z38 的 概率 出 现 数字 29， 你 赢 35 美元 ; 以 37/38 的 概率 出 现 其 他 的 数字 ， 你 输 
1 美元 。 如 果 我 们 都 同意 把 输 了 的 钱 当 作 是 负数 收入 的 话 ， 那 么 一 轮 游戏 之 后 你 
的 收入 可 能 是 35 也 可 能 是 -1。 无 论 你 的 收入 是 正 还 是 负 ， 你 一 轮 游戏 的 收入 期 
望 值 为 
35 x1/38 +( -1)x37/38 = -2/38~ -0.0526 
即 平均 每 次 约 期 望 损失 5 美 分 。 这 个 值 又 是 一 个 在 现实 中 不 能 单独 实现 ， 必 须 从 
长 期 的 角度 上 来 解释 的 例子 。 从 长 远 来 看 ， 每 旋转 38 次 轮 盘 每 个 数字 都 会 出 现 
一 次 。 当 你 每 一 次 都 押 1 美元 在 数字 29 上 ， 经 过 38 次 下 注 ， 你 会 输 掉 37 美元 
赢 35 美元 ， 最 终 输 了 2 美元 。 
在 轮 盘 游戏 虽 上 你 常常 会 看 见 有 许多 人 一 次 会 在 几 个 不 同 的 数字 上 下 注 ， 有 
时 甚至 会 在 所 有 的 数字 上 下 注 。 这 种 方法 显然 会 增加 每 一 次 中 奖 的 概率 ， 但 是 从 
长 远 角度 上 说 却 不 会 让 你 有 任何 收入 的 增加 。 事 实 上 ， 在 每 一 个 数字 上 你 每 下 
1 美元 的 注 平均 就 会 损失 5 美 分 。 假 设 你 现在 在 10 个 不 同 的 数字 上 分 别 下 1 美元 
的 注 ， 期 望 值 的 可 加 性 告诉 你 : 你 平均 会 损失 50 美 分 。 不 管 你 采取 什么 样 的 下 
注 策略 ， 庄 家 总 是 能 从 每 1 美元 中 赚 取 5 美 分 。 这 上 听 起 来 似乎 没有 多 少 钱 ， 但 是 
对 于 庄家 来 说 却 能 赚 得 盆 满 钵 满 。 
作为 练习 ， 让 我 们 来 计算 一 个 从 名 字 看 起 来 只 靠 运 气 的 游戏 “ 碰 运 气 ” 
( Chuck-A-Luck) 游戏 的 期 望 值 ( 译 者 注 : “ 碰 运 气 ”游戏 的 玩法 就 是 摇 三 
个 骨 子 然后 猿 猜 会 有 多 少 个 骨 子 翻 到 玩家 先前 选 定 的 数字 )。 假 设 你 下 了 1 
美元 的 注 ， 当 摇 出 一 个 6 时 ,你 说 1 美元 ; 当 摇 出 两 个 6 时 ， 你 赢 2 美元 ; 
当 摇 出 三 个 6 时， 你 赢 3 美元 。 当 且 仅 当 没 有 摇 出 6 时 ， 你 输 了 下 注 的 1 美 
元 。 在 1.4 节 中 ， 我 们 介绍 了 你 赢 的 概率 是 0.42 ， 所 以 输 掉 这 1 美元 的 概率 
就 是 0.58 。 但 是 你 也 许 顾 的 钱 不 止 1 美元 ， 所 以 并 不 能 立刻 得 出 该 游戏 于 你 
不 利 这 个 结论 。 每 次 播 到 不 同 个 数 的 6 的 概率 是 不 同 的 ， 分 别 为 : 
P( 没 有 6) = (5/6)?=125/216 寺 0. 58 
P(1 个 6) =3 x1/6x(5/6)?=75/216 二 0. 35 
P(2 个 6) =3x(1/6)? x5/6=15/216 寺 0.07 
P(3 个 6)=(1/6)’”=1/216 二 0. 005 
因为 每 一 颗 散 子 都 是 不 同 的 ， 所 以 当 揪 到 一 个 6 和 两 个 6 时 必须 要 乘 以 3 (事实 
上 ， 依 据 第 1 章 的 介绍 ， 不 同 个 数 的 6 也 符合 二 项 式 分 布 ) 。 因 为 上 面 的 四 个 概 
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率 在 计算 的 过 程 中 都 已 经 被 四 售 五 人 了 ， 所 以 它们 加 起 来 的 总 和 并 不 等 于 1。 那 
么 我 们 现在 来 计算 期 望 值 。 你 的 收入 与 出 现 6 的 个 数 相等 ; 但 如 果 没 有 出 现 6， 
你 得 到 的 就 是 -1。 所 以 在 “ 碰 运 气 ” 游 戏 中 收入 的 期 望 值 是 
(—1)x125/216 +1 x75/216 +2 x15/216 +3 x1/216~ -0.08 

这 就 意味 着 你 每 下 1 美元 的 注 就 要 输 掉 8 美 分 。 从 财务 的 角度 看 ， 这 个 游戏 会 
比 轮 盘 游 戏 让 你 输 得 更 惨 。 当 然 你 可 以 想象 每 216 次 所 有 的 情况 都 出 现 一 次 的 
完美 场景 。 三 个 仍 子 都 摇 出 6 的 情形 只 会 出 现 一 次 ， 这 一 次 你 会 万 3 美元 。 而 
摇 出 两 个 6 从 而 赢得 2 美元 的 情形 有 15 种 ， 播 出 一 个 6 从 而 赢得 1 美元 的 情形 
有 75 次 ， 剩 下 的 125 种 情况 都 不 会 出 现 6。 因 此 下 的 216 美元 的 赌注 会 让 你 损 
失 17 美元 。 

现在 假设 你 进行 另 一 种 形式 的 赌博 : 股票 投资 。 一 个 朋友 告诉 你 在 接 下 来 的 
几 年 中 某 一 个 共同 基金 每 年 要 么 上 涨 50% 要 么 下 跌 40%， 上 涨 和 下 跌 的 概率 相 
等 。 如 果 你 投资 了 1000 美元 ， 那 么 你 预期 两 年 之 后 这 笔 钱 变 成 多 少 呢 ? 

首先 我 们 考虑 第 一 年 的 情况 。 第 一 年 之 后 你 的 投资 等 可 能 地 变 成 1500 美元 
或 者 600 美元 ， 平 均 所 得 为 1050。 所 以 增加 50% 和 减少 40% 的 平均 数 是 增加 
5% ， 所 以 你 可 以 预期 每 年 都 增加 5% 。 两 年 之 后 你 预期 的 投资 财产 就 变 成 了 
1000 x1.05 x1.05 =1102. 50 美元 。 另 一 方面 你 投资 的 基金 上 涨 与 下 跌 都 是 等 可 
能 的 ， 所 以 你 可 以 预计 这 两 年 中 一 年 上 涨 男 一 年 下 跌 。 不 管 是 哪 一 年 上 涨 ， 两 年 
之 后 你 的 投资 都 会 变 成 1000 x 1. 05 x0.60 = 900 美元 。 这 样 看 起 来 似乎 有 些 矛 
导 。 你 怎么 能 预期 你 的 投资 又 升值 又 贬值 呢 ? 

这 就 在 于 你 如 何 看 待 “预期 ”这 个 词 。 你 的 投资 在 两 年 之 后 的 预期 值 是 
1102. 50 美元 。 这 两 年 的 投资 状况 共有 四 种 可 能 的 情况 : 上涨 一 上 涨 、 上 涨 一 下 
跌 、 下 跌 一 上 涨 、 下 跌 一 下 跌 。 这 四 种 情况 对 应 的 两 年 之 后 的 投资 值 分 别 是 2250 
美元 、900 美元 、900 美元 和 360 美元 ,平均 值 就 是 1102. 50 美元 。 但 如 果 你 计 
算 的 是 预计 “好 年 景 ”数量 ， 这 个 数字 是 一 。 最 可 能 出 现 的 情况 是 一 个 好 年 景 
一 个 坏 年 景 。 在 这 种 情况 下 最 可 能 的 值 就 是 900 美元 ， 它 被 称 为 众 数 (mode ) 
或 众 数值 (modal value) 。 你 可 以 任意 选择 一 种 你 认为 合适 的 方案 来 计算 投资 预 
期 值 。 虽 然 两 年 之 后 你 投资 的 预期 值 是 增加 的 ， 但 是 实际 中 只 有 在 两 年 都 是 好 年 
景 的 情况 下 投资 才 会 增值 ， 概 率 仅 为 23% 。 如 果 你 将 这 个 投资 计划 与 另外 一 个 
每 年 固定 增长 5% 的 计划 相 比 ， 这 两 个 计划 大 体 上 增值 是 差不多 的 且 一 年 之 后 增 
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值 幅度 也 是 等 可 能 的 。 但 是 固定 增长 5% 的 方案 比 共同 基金 投资 方案 在 两 年 之 后 
收益 大 的 概率 高 达 75% 。 如 果 要 进行 比较 的 话 ， 单 独 每 年 进行 对 比 两 个 方案 不 
存在 优 劣 之 分 ， 但 是 如 果 超 过 一 年 则 固定 增长 的 投资 方案 更 加 有 利 。 这 看 起 来 非 
常 矛 盾 。 随 着 时 间 的 流逝 ， 你 预期 资本 每 年 增加 5% ,但 是 每 两 年 你 的 资本 最 可 
能 的 变化 确实 减少 10% 。20 年 之 后 ， 你 最 初 投资 的 1000 美元 如 果 依 据 期 望 投资 
回报 增长 ， 就 变 成 了 2653 美元 ; 而 如 果 按 照 最 差 的 预期 它 会 变 成 349 美元 。 如 
果 和 希望 20 年 后 的 实际 资本 比 现在 多 ,那么 这 20 年 中 至 少 有 12 年 该 基金 必须 是 
上 涨 的 。 这 一 概率 大 概 约 25% 。 

这 个 例子 在 现实 中 可 能 不 会 发 生 ， 但 它 说 明了 一 个 原则 : 减少 远 比 增加 带 
来 的 影响 大 。 比 如 先 增 加 50% 再 减少 50% (或 者 先 减 少 50% 再 增加 50% ) ， 
最 后 你 的 净 损 失 为 23% 。 而 如 果 增 加 10% ， 减 少 10% ,最 后 的 净 损 失 为 
1% 。 如 果 每 年 的 损失 和 收益 是 相等 的 ， 那 么 你 预期 资本 每 年 会 保持 不 变 ; 
但 是 如 果 要 保持 资本 不 减少 你 就 必须 保证 好 年 景 比 坏 年 景 要 多 。 当 每 年 增长 
的 量 比 损失 的 量 要 稍微 大 一 些 时 ， 这 一 原则 依然 正确 (例如 上 一 段 中 举 的 例 
了 于) 

如 果 当 要 时 着 风险 投资 时 ， 仅 仅 考 虑 预期 收入 是 不 够 的 ， 你 必须 要 权衡 风险 
和 收益 。 虽 然 中 奖 的 概率 很 低 ， 你 依然 会 买 一 张 乐 透 彩票 期 待 中 大 奖 。 但 是 如 果 
我 让 你 下 1000 美元 的 注 ， 押 硬币 的 正面 朝 上 ， 如 果 押 中 了 我 就 给 你 1100 美元 。 
即使 预期 的 收入 有 50 美元 ， 你 可 能 也 不 会 跟 我 玩 这 个 游戏 。 从 长 远 来 看 我 肯定 
会 输 ， 但 是 只 赌 一 次 的 话 你 也 许 不 愿意 冒 这 个 损失 1000 美元 的 风险 来 启 100 美 
元 。 当 进行 投资 时 ， 你 也 会 面 对 类 似 的 问题 。 你 是 该 去 投资 那些 高 风险 高 收益 的 
股票 还 是 该 投资 低 风险 的 共同 基金 和 债权 呢 ? 你 在 决策 时 要 充分 考虑 预期 回报 ， 
但 是 这 不 应 当 是 唯一 要 考虑 的 因素 。 

下 面 这 个 例子 就 说 明了 认真 考虑 预期 值 会 为 你 节约 时 间 和 金钱 。 第 二 次 世界 
大 战 期 间 ， 数 千 万 的 美国 应 征 者 在 入 伍 前 都 进行 了 梅毒 检测 ， 预 计 大 概 有 几 千 人 
感染 了 这 种 病 。 化 验 血 样 是 一 个 非常 耗 时 和 昂贵 的 过 程 。 哈 佛经 济 学 家 罗伯特 . 
陶 夫 曼 (Robert Dorfman) 想 出 了 一 个 非常 聪明 的 主意 。 他 建议 把 所 有 人 分 成 不 
同 群 组 ， 将 每 一 组 所 有 人 的 血 都 混合 成 一 份 血样 。 如 果 这 一 份 血样 化 验 出 来 是 阴 
性 的 ， 那么 这 一 整 组 的 人 就 都 是 健康 的 。 而 如 果 这 一 份 血样 化 验 出 来 是 阳性 的 ， 
那么 这 一 组 中 的 人 就 要 分 开 一 一 再 做 一 次 检查 。 这 个 方法 的 关键 之 处 就 在 于 通过 
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化 验 一 份 血样 就 能 宣告 一 整 组 的 人 是 否 是 健康 的 。 这 种 方法 可 以 被 用 在 大 范围 检 
测 罕 见 疾 病 的 案例 中 。 让 我 们 看 看 这 种 方法 背后 的 数学 原理 吧 。 

令 每 组 人 的 数量 为 >， 每 个 人 患 病 的 概率 为 np.9 根 据 概率 第 一 法 则 , “没有 
人 ”的 反面 对 应 的 是 “有 些 人 ”。 所 以 如 果 一 组 中 有 些 人 患 病 了 ， 那 么 就 要 再 重 
新 针对 每 个 人 进行 化 验 。 假 设 每 个 人 是 否 患 病 的 事件 是 独立 的 ， 某 个 人 没有 患 病 
的 概率 是 1-p, 那么 这 一 群 人 都 没有 患 病 的 概率 为 (1 -p)"。 所 以 这 一 和 群 人 中 有 
人 患 病 的 概率 是 1- (1 -p)"， 这 也 是 混合 血样 被 检测 出 阳性 的 概率 。 此 时 对 这 
一 组 人 还 需要 再 进行 n 次 化 验 。 第 一 次 检测 之 后 ， 有 (1 -p)" 的 概率 是 不 需要 进 
一 步 化 验 的 ; 而 有 1- (1 -p)" 的 概率 还 需要 再 进行 n 次 化 验 。 所 以 这 种 混合 的 
方法 预计 需要 进行 的 测试 次 数 为 

l+nx[1-(1-p)"] 
式 中 第 一 项 1 是 因为 一 定 会 进行 一 次 化 验 ， 而 0 x (1 -p)" 这 第 二 项 理应 加 上 ， 
但 由 于 它 的 值 为 0， 所 以 它 被 忽略 了 。 把 这 个 期 望 值 与 n (如 果 每 一 个 个 体 都 进 
行 单独 的 样本 检测 ) 进行 比较 。 我 们 先 代入 一 些 数值 计算 。 如 n=20 时 , p= 
0.01。 那 么 1 -p=0.99， 那 么 预期 化 验 数 量 为 
1 +20 x (1 -0.99”)~4.6 

这 个 数 显 然 比 20 次 单独 试验 要 小 得 多 。 因 为 使 用 混合 方法 需要 进行 21 次 化 验 而 
不 是 20 次 ， 在 最 极端 的 情况 下 ， 如 果 混 合 的 血样 旦 阳性 ， 混 合 方 法 所 要 进行 的 
化 验 只 比 每 个 都 检测 的 方法 多 了 一 次 (在 两 种 方法 比较 时 不 需要 重新 抽 血 ， 一 开 
台 每 个 人 抽出 来 的 血 已 经 分 成 两 份 给 两 种 方法 了 ) 。 混 合 的 血样 旺 阳性 的 概率 为 
1 -0.99"“=0.18， 所 以 当 每 组 有 20 人 时 ， 大 约 18% 的 组 需要 再 对 每 个 组 员 血 
液 进行 单独 的 化 验 。 这 种 混合 方法 有 一 个 现实 的 顾虑 。 如 果 一 组 的 人 数 太 多 ， 
那么 混合 起 来 的 血液 样本 可 能 过 于 稀释 从 而 导致 某 些 病人 没有 办 法 在 整个 组 
血液 的 化 验 中 检测 出 来 。 然 而 在 梅毒 案例 中 ， 陶 夫 曼 指出 这 些 诊断 检测 都 是 
非常 敏感 的 ， 即 使 抗原 的 浓度 很 小 也 可 以 被 检测 出 来 。 陶 夫 曼 的 原文 于 1943 
年 发 表 在 《数理 统计 年 鉴 》( Annals of Mathematical Statistics) 上 上， 原文 叫做 












































”流行 病 学 家 用 患 病 率 ( Prevalence) 这 个 术语 来 形容 特定 疾病 或 条 件 在 人 群 中 的 比例 。 比 如 1000 
个 人 中 25 个 人 患 病 这 一 患 病 率 转 化 成 我 们 的 数学 语言 就 变 成 了 p =0. 025。 患 病 率 的 相关 术语 是 
发 生 率 ; 发 生 率 表示 在 特定 的 时 间 段 中 新 的 病例 增加 的 比例 。 
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《如 何在 庞大 人 群 中 发 觉 次 等 人 》 (这 个 名 字 在 政治 立场 上 是 不 正确 的 ) 。 除 了 
血液 化 验 之 外 ， 混 合 方法 还 有 许多 其 他 的 用 处 ， 比 如 水 检测 、 空 气 检测 或 土地 
质量 的 检测 。 

让 我 最 后 为 那些 理论 爱好 者 做 一 些 总 结 吧 。 首 先 ， 期 望 值 通常 都 会 用 人 ( 希 
腊 字 母 “mu”) 来 表示 。 如 果 每 一 个 可 能 出 现 的 值 为 x, ，x,，…， 对 应 的 概率 为 
p1，pP;，"…， 那 么 期 望 值 的 公式 为 

KM=X Xp 十 MX Xp, 十 

根据 实际 例子 中 的 要 求 这 个 求 和 公式 会 一 直 续 写 下 去 。 在 找 骨 子 的 例子 中 ， 这 个 
公式 会 在 6 的 时 候 停 下 来 ，x, =6, 六 = 1/6。 而 对 于 1.9 节 中 介绍 的 二 项 式 分 布 
的 例子 ， 随 着 n 次 独立 试验 中 成 功 的 次 数 而 改变 , 但 每 一 次 成 功 的 概率 都 是 p。 
可 能 出 现 的 结果 从 0，1，…，n， 而 对 应 的 概率 在 1. 9 节 中 已 经 给 出 了 。 那 么 此 
时 成 功 情况 下 期 望 值 为 








MK = YA xC xp’ x (1-p)"™ 
因为 没有 具体 赋值 ， 这 个 公式 还 没有 办 法 出 结果 。 但 是 在 实例 中 很 容易 猜 出 结 
是 什么 。 如 果 你 扔 100 次 便 币 ， 多 少 次 正面 朝 上 呢 ? 50 次 。 如 果 你 掷 600 次 由 
子 ， 那 么 能 掷 出 多 少 次 6? 100 次 。 这 两 个 例子 中 ， 期 望 值 都 是 试验 次 数 和 成 功 
概率 的 乘积 。 整 体 说 来 是 正确 的 。 因 此 二 项 式 分 布 中 参数 n 和 pp 的 期 望 值 是 n xp 
( 像 往常 一 样 ， 期 望 值 不 一 定 能 在 实际 中 取 到 ) 。 如 果 你 熟悉 牛顿 二 项 式 定 理 ， 
你 就 能 证 明 上 面 给 出 的 关于 的 表达 式 实际 上 就 等 于 xp。 


5.2 美好 的 事情 留 给 耐心 等 待 的 人 


上 一 节 中 我 们 介绍 了 期 望 值 公式 ， 在 有 些 情况 下 这 个 公式 会 一 直 不 断 受 加 。 
这 并 不 意味 着 我 们 要 永远 无 止境 地 去 计算 ， 而 只 是 为 了 说 明 如 果 可 能 的 结果 没有 
明显 的 限制 那么 我 们 会 得 到 一 个 无 穷 的 和 。 比 如 ， 你 反复 扔 硬币 想 要 计算 出 多 少 
次 之 后 才 会 正面 朝 上 。 从 理论 上 说 ， 这 个 数字 可 以 是 任何 正 整数 。 等 扔 到 第 643 
次 的 时 候 才 会 扔 到 正面 朝 上 ， 这 听 超 来 似乎 不 可 能 ， 但 是 你 没有 办 法 排除 它 。 所 
以 出 现 的 可 能 性 是 无 穷 的 。 我 已 经 说 过 了 概率 学 家 们 是 不 怕 听 到 “无 穷 ” 这 个 
词 的 。 我 们 可 以 将 计算 期 望 值 的 公式 改写 成 : 
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p= Or Xp 
其 中 ~ 表示 无 穷 ， 说 明 这 个 和 永远 无 法 穷尽 。 这 是 高 等 数学 中 一 个 复杂 之 处 : 你 
可 以 用 一 个 有 限 的 数字 来 表示 无 限 数 字 之 和 。p, 的 值 最 后 会 变 得 非常 非常 的 小 。 
比如 ， 扔 到 第 643 次 的 时 候 才 会 扔 到 正面 朝 上 的 事件 概率 为 (1/2)”“”， 这 个 数字 
的 小 数 点 之 后 跟着 193 个 零 。 对 于 第 次 才 会 正面 朝 上 的 事件 概率 为 (1/2) ， 所 
以 期 望 值 等 于 








S (1/2)° =1x(lM2)+2x(1M2) + 3x (1/2) + … 
不 管 你 信 不 信 ， 这 个 看 似 复 杂 的 表达 式 最 终 计算 出 来 的 值 等 于 2。 这 个 结果 通过 
我 们 的 直观 想象 也 能 得 出 。 因 为 每 扔 一 次 硬币 有 一 半 的 机 会 正面 朝 上 ， 平 均 每 扔 
两 次 就 有 一 次 正面 朝 上 ， 所 以 你 预期 大 概 两 次 就 会 出 现 正面 朝 上 的 结果 。 把 成 功 
的 概率 从 1/2 改 成 1/6， 一 个 看 起 来 更 复杂 的 求 和 公式 的 值 等 于 6; 因此 你 平均 
需要 掷 6 次 才 掷 出 数字 6。 然 后 将 成 功 的 概率 再 改 成 /38 ， 你 可 以 发 现在 轮 盘 游 
戏 中 每 一 个 数字 大 约 转 38 次 会 出 现 一 次 。 一 般 说 来 如 果 某 事件 发 生 的 概率 为 p， 
你 就 需要 等 待 1/p 次 。 学 习 概率 让 你 明白 数 学 和 直觉 在 某 些 情况 往往 会 重合 。 另 














外 一 个 收获 当然 就 是 更 多 时 候 数学 和 直觉 往往 不 一 致 ， 至 少 无 法 立刻 一 致 ， 所 以 
会 觉得 某 些 结果 非常 惊人 。 经 过 之 前 的 概率 学 习 ， 你 会 发 现 概率 就 是 拥有 这 样 
复杂 又 矛盾 的 魅力 。 


下 面 再 介绍 一 种 新 的 方法 ， 它 不 需要 通过 这 种 无 限 求 和 的 计算 就 能 知道 第 一 
次 出 现 正面 朝 上 、 掷 出 6 和 轮 盘 上 出 现 某 个 数字 的 预期 值 。 想 一 想 我 们 在 1.7 节 
中 介绍 的 计算 球拍 类 运动 中 胜率 的 问题 时 提 到 的 ， 在 计算 到 某 一 处 时 又 回 到 了 原 
点 ， 因 此 就 会 出 现 一 个 等 式 。 在 这 里 我 们 同样 也 可 以 运用 到 递归 法 。 假 设 某 事 件 
发 生 的 概率 为 p， 令 人 表示 等 待 次 数 的 期 望 值 。 在 第 一 次 试验 中 该 事件 或 者 发 生 
或 者 没有 发 生 。 如 果 事 件 发 生 了 ,那么 等 待 次 数 为 1。 如 果 事 件 没 有 发 生 ， 那 么 
你 就 又 重新 开始 一 轮 预 计 风 次 的 等 待 ， 所 以 你 要 进行 1 + 次 试验 。 前 一 种 情况 
发 生 的 概率 为 p， 后 一 种 情况 发 生 的 概率 为 1 -p， 因 此 你 可 以 得 到 如 下 等 式 : 

人 =Dxl+(L1-p)x(1+A) 
=] +h -pxk 

这 个 等 式 可 以 进一步 简化 为 0 =1 -p xu， 最 后 得 到 j=1/p。 
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让 我 们 看 等 待 事件 发 生 问题 的 一 种 变型 。 在 《 宋 飞 正 传 》 中 有 一 集 “ 洋 娃 
娃 ”。 杰 里 在 食品 盒 中 发 现 了 一 个 恐龙 玩具 ， 他 非常 的 高 兴 〈 就 在 伊 莱恩 刚 说 完 
他 还 是 一 个 孩子 的 时 候 ) 。 我 们 假设 在 这 种 食品 盒 中 能 发 现 10 种 不 同 的 塑料 玩 
具 。 为 了 集 齐 这 10 种 不 同 的 玩具 ， 杰 里 最 可 能 要 买 多 少 盒 呢 ?这 个 问题 直接 用 
期 望 值 的 定义 很 难 解决 。 此 时 你 需要 计算 出 上 个 食品 盒 对 应 的 可 能 值 丰 的 概率 ; 
但 是 由 于 这 个 问题 没有 上 限 ， 杰 里 可 以 买 376 盒 或 12971 盒 ， 所 以 这 个 问题 非常 
的 棘手 。 

我 们 要 有 一 个 巧妙 的 方法 来 解决 。 首 先 ， 杰 里 买 了 一 盒 并 在 其 中 发 现 了 和 恐龙 
玩具 。 那 么 要 得 到 另外 一 个 不 同 的 玩具 ， 杰 里 还 需要 买 的 食品 盒 数 的 期 望 值 是 多 
少 ? 得 到 另外 一 个 不 同 玩具 的 概率 是 9/10， 所 以 预计 要 买 107X9 盒 (上 文中 已 经 
说 明了 概率 为 p 时 怎么 计算 期 望 值 )。 当 他 有 了 两 个 不 同 的 玩具 时 ， 他 开始 等 待 
剩 下 的 八 个 玩具 中 的 任何 一 个 。 此 时 概率 为 8/10， 期 望 值 为 10/8。 接 下 来 数据 
变 成 了 10/7 盒 、10/6 盒 ， 一 直到 需要 买 10/2 =5 盒 来 得 到 倒数 第 二 个 玩具 ， 最 
后 一 个 玩具 则 预计 需要 买 10/1 = 10 盒 才能 得 到 。 因 为 期 望 值 具有 可 加 性 ， 所 以 
杰 里 为 了 获得 这 10 个 不 同 的 玩具 预计 要 买 

1 +10/9 +10/8+:… +10/2 +10/1~29 
个 盒子 。 为 了 得 到 最 后 一 个 不 同 的 玩具 需要 买 10 盒 ( 占 总 数 的 1/3)， 这 大 概 是 所 
有 父母 的 梦 麻 。 上 面 这 个 表达 式 可 以 被 改写 成 为 另外 一 种 更 高 级 的 数学 表达 式 


10x(1+3 + + + 二 
其 中 括号 里 的 10 个 数字 组 成 调和 级 数 。 随 着 次 数 n 的 不 断 变 大 ，Hh, 越 来 越 接 
近 的 自然 对 数 ， 即 log (有 时 也 写成 mn n)， 这 是 一 个 经 典 的 数学 表达 式 。 
数字 x 的 自然 对 数 需 要 e 不 断 自 乘 得 到 。 所 以 ， 如 果 er = 处 ， 那么 y 就 是 x 的 自 
然 对 数 : y = log x。 呈 随 着 nn 不断 变 大 ，H, -log n 的 值 也 不 断 趋 近 于 欧 拉 常 数 ， 





























加 ”还 有 一 种 更 为 常见 的 对 数 ， 就 是 用 10 来 代替 数字 e。 比 如 因为 10 是 100， 所 以 2 是 以 10 为 底 
100 的 对 数 。 同 理 你 可 以 用 其 他 的 数 作为 对 数 的 底 。 如 4 =64， 所 以 3 是 以 4 为 底 64 的 对 数 。 古 
巴比伦 人 非常 喜欢 以 60 作为 底数 ， 我 们 至 今 在 计时 时 依然 用 60 进 制 。 在 日 常数 学 学 习 中 我 们 通 
常会 用 10 作为 底数 ; 计算 机 科学 家 则 喜欢 用 2 作为 底数 (2 进 制 ) 或 用 16 作为 底数 (十 六 进 
制 ) 。 但 是 对 于 数学 家 们 来 说 以 e 为 底数 才 是 最 有 价值 的 。 
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其 值 约 等 于 0. 58 .9 现在 我 们 就 可 以 为 玩具 的 例子 写 出 一 个 完整 的 公式 了 

品 盒 的 数量 的 期 望 值守 n x (log n +0. 58) 
当 n=10 时 ,结果 为 28. 8 ， 接 近 我 们 之 前 计算 出 来 的 29。 如 果 非常 的 大 ， 那 
么 我 们 需要 把 常数 0. 58 提取 出 来 〈 参 见 脚注 2 ) 。 这 一 类 型 的 问题 并 非 是 杰 里 最 
先 提出 来 的 ， 它 是 一 个 典型 的 概率 问题 ， 通 常 叫做 “优惠 券 收集 问题 ”， 并 在 不 
同 的 场景 中 出 现 。 

另外 一 种 相关 的 问题 是 “占有 问题 ”。 当 杰 里 知道 如 果 他 买 了 29 盒 食 物 就 可 
以 集 齐 10 种 不 同 的 玩具 ， 他 打算 去 食品 店 一 次 性 买 29 盒 。 那 么 此 时 预计 他 能 得 
到 多 少 种 不 同 的 玩具 呢 ? 结果 当然 不 是 10 种 。 当 他 运气 特别 差 的 时 候 ， 很 可 能 
29 盒 里 都 是 慌 龙 玩具 ， 此 时 的 概率 为 〈(1/10)。 因 为 有 10 种 不 同 的 玩具 ， 连 续 
29 盒 中 可 能 都 是 其 中 的 某 一 种 玩具 ， 所 以 将 这 一 概率 乘 以 10。 预 计 能 够 得 到 的 
玩具 种 类 的 期 望 值 肯定 在 1 ~ 10 之 间 , 但 是 想 要 直接 计算 出 来 非常 困难 。 期 望 值 
的 可 加 性 再 次 出 场 帮助 我 们 解决 这 一 问题 。 

把 所 有 的 盒子 都 打开 ， 先 找 找 是 否 有 慌 龙 玩具 。 如 果 这 些 盒 子 里 有 疏 龙 玩 
具 ， 那 么 记 作 “1”， 否 则 记 作 “0”( 即 使 找到 一 个 以 上 的 恐龙 玩具 也 记 作 “17; 
你 不 用 去 数 究 竞 有 几 个 恐龙 玩具 ) 。 接 着 找 另 外 一 种 类 型 的 玩具 ， 比 如 SAAB 900 
(在 《 宋 飞 正 传 》 中 有 好 几 集 都 提 到 了 这 个 汽车 模型 ) 。 不 管 找到 几 个 ， 都 记 作 
“1”， 否 则 记 作 “0”。 其 他 类 型 的 玩具 也 是 如 此 。 当 你 进行 了 10 次 ， 你 就 记 下 
了 10 个 数字 (1 或 者 0) 。 把 这 10 个 数字 相 加 ， 得 到 的 数字 就 是 你 拥有 的 不 同类 
型 的 玩具 (如 果 和 为 10， 这 表示 10 种 不 同 的 玩具 都 集 齐 了 ) 。 所 以 利用 期 望 值 
的 可 加 性 ， 你 可 以 将 这 10 个 数字 相 加 得 到 最 终 的 期 望 值 。 因 为 买 来 的 食品 盒 中 
每 种 玩具 的 概率 是 一 样 的 ， 所 以 这 些 单 个 的 期 望 值 也 是 相等 的 。 那 么 最 终 的 期 望 
值 究竟 是 多 少 呢 ? 

要 得 到 这 个 值 我 们 只 需要 知道 出 现 “1” 和 “0” 的 概率 是 多 少 。 如 果 出 现 



































加” 莱 昂 纳 德 ， 欧 拉 (Leonhard Euler) ， 瑞 士 数学 家 ， 生 于 1707 年 卒 于 1783 年 ， 是 最 伟大 的 数学 家 之 
一 。 他 的 学 术 成 就 斐然 ,近乎 在 数学 每 一 个 分 支 均 有 造 话 。 他 的 作品 合集 有 70 卷 ， 有 许多 著名 的 
数学 成 果 都 是 以 他 的 名 字 命名 。 当 你 说 欧 拉 定理 时 ， 你 必须 要 说 明 用 的 是 哪 一 条 定理 。 文 中 提 及 
的 欧 拉 常数 是 一 个 无 限 不 循环 小 数 ， 其 值 等 于 0. 5772156 ……- 至 于 欧 拉 常数 是 不 是 一 个 有 理 数 
(是 否 能 改写 成 分 数 ) 至 今 依然 是 一 个 迹 题 。 












































生活 中 的 概率 趣事 


1 的 概率 是 p， 那 么 出 现 0 的 概率 就 是 1 -pp， 此 时 期 望 值 为 
Ox(1-p)+1 xp=p 
把 10 个 这 样 的 期 望 值 相 加 ， 我 们 可 以 知道 最 终 的 期 望 值 就 是 10 xp。 接 下 来 计算 
7 的 值 。 当 至 少 有 一 个 仙 龙 玩具 时 我 们 都 将 其 计 为 “1”。 这 时 可 以 用 到 万 能 的 概 
率 第 一 法 则 ， 用 1 减 去 没有 恐龙 玩具 的 概率 ， 因 此 
P( 至 少 有 一 个 恐龙 玩具 ) =1 - (9/10)” 

期 望 值 等 于 10 x [1 (9/10)”] =9.5。 所 以 态 里 小 朋友 集 齐 10 个 玩具 的 概率 非常 高 。 

我 们 可 以 用 一 个 公式 来 总 结 “ 优 惠 券 收集 问题 ”和 “占有 问题 ”。 假 设 有 
n 种 不 同类 型 的 物品 ， 你 试 着 一 一 收集 这 些 物 品 。 那 么 预计 要 尝试 





nx > (1/k) =n x (logn +0.58) 
次 才能 得 到 全 部 的 n 种 物品 。 如 果 你 尝试 了 N 次 , 那么 预期 可 以 得 到 
nx [1 - (二 】 ] 种 不 同 的 物品 。 当 六 足够 大 时 ， 这 个 数字 与 "非常 接近 。 


“1” 和 “0” 表 示 某 种 类 型 的 礼物 是 否 存在 ， 所 以 它们 被 称 为 “指标 " 。 用 指 
标 方 法 来 计算 期 望 值 是 一 种 非常 有 效 的 方法 ， 读 者 们 是 否 还 记得 我 们 在 3.5 节 中 介 
绍 的 配对 例子 。 你 随机 写 从 1 到 的 数字 , 不论 nn 多大, 没有 一 对 配对 (没有 一 
个 数字 是 在 对 应 的 位 置 上 ) 的 概率 都 是 0.37。 我 们 通过 计算 一 对 配对 、 两 对 配 
对 ……' 的 概率 ， 最 后 再 来 计算 期 望 值 。 用 指标 法 就 可 以 将 计算 简化 很 多 。 将 配对 的 
数字 记 作 “17”， 不 配对 的 数字 记 作 “0”， 将 所 有 的 “1” 和 “0” 相 加 得 到 的 数字 
就 是 配对 数 。 我 们 只 需要 知道 特定 位 置 上 的 数字 配对 的 概率 ， 然 后 乘 以 n 就 能 知道 
预期 的 配对 数 。 这 看 起 来 非常 简单 。 因 为 数字 是 随机 分 配 的 ， 那 么 在 特定 位 置 上 配 
对 的 概率 就 是 1/n， 因 此 预期 的 配对 数 是 n x1/n =1。 同 理 ， 不 论 多 少 个 人 把 他 们 
的 帽子 落 在 派对 上 ， 预 计 总 有 一 个 人 可 以 恰好 拿 回 自己 的 帽子 。 





5.3 ”期 待 意料 之 外 


在 前 儿童 中 我 们 介绍 了 很 多 通过 计算 得 到 非常 意外 或 违反 直觉 概率 的 例子 。 
对 于 期 望 值 来 说 也 是 如 此 。 下 面 我 们 会 介绍 儿 个 例子 。 第 一 个 例子 是 随机 儿 何 学 
的 例子 。 


第 5 章 超越 概率 : 你 在 期 待 什么 


你 随手 画 一 个 正方 形 ， 边 长 由 投 骨 子 来 决定 ， 正 方形 的 面积 就 是 边 长 的 平 
方 。 所 以 令 边 长 为 $， 面 积 为 4， 依 据 等 式 4 =S?， 可 能 的 边 长 为 1,，2, 3, …, 6; 
面积 为 1，4，9，…，36。 简 单 又 容易 吧 ， 让 我 们 来 计算 一 下 期 望 边 长 和 面积 。 
计算 期 望 边 长 很 简单 ， 我 们 已 经 算出 来 了 是 3.5。 那 么 期 望 面积 就 是 3. 3” = 12. 25 
吧 ? 我 们 还 是 不 要 轻易 下 结论 ， 计 算 一 下 吧 。 边 长 的 每 个 长 度 情 况 都 是 等 概率 的 
1/6， 因 此 对 应 的 面积 也 是 等 概率 的 1/6， 那 么 预期 面积 ， 

1 x1/6 +4 x1/6+:… +36 x1/6~15.2 
并 不 等 于 12. 25。 显 然 我 们 不 能 想当然 认为 期 望 边 长 的 平方 就 是 期 望 面积 。 其 实 
只 要 想 想 平均 数 就 可 以 明白 。 比 如 边 长 1 必须 由 边 长 6 来 弥补 ， 从 而 得 到 平均 数 
3.5。 当 你 计算 对 应 面积 时 ，1 和 36 的 平均 数 是 18.5， 这 显然 不 是 3.5 的 平方 。 
同 理 ，2 与 5 的 平均 数 是 3.5， 但 对 应 面积 4 和 25 的 平均 数 是 14. 5。 从 整体 来 
看 ， 所 有 面积 的 平均 数 大 约 等 于 15.2， 这 个 数字 比 期 望 边 长 的 平方 是 要 大 一 点 
的 。 因 为 面积 是 通过 边 长 的 平方 来 变化 的 ， 所 以 其 增长 的 幅度 比 边 长 增长 的 幅度 
要 大 。 所 以 当 你 说 “平均 正方 形 的 边 长 为 3.5， 面 积 为 13. 2” 时 ， 听 起 来 荒诞 可 
笑 ， 现 实 中 你 是 永远 没有 办 法 画 出 这 样 一 个 平均 正方 形 的 。 

我 们 再 来 玩 一 个 简单 的 游戏 吧 。 你 和 你 的 朋友 掏 出 钱包 ， 分 别 数 一 数 钱 包 里 
的 现金 。 游 戏 规则 是 : 比 谁 钱 包 里 的 现金 多 ? 多 的 人 要 把 钱 全 给 另外 一 个 人 
(如 果 你 们 钱包 里 现金 的 数量 是 一 样 的 ， 那 么 就 不 用 做 任何 事 ) 。 你 同意 玩 这 个 
游戏 吗 ? 你 也 许 会 想 : 我 知道 自己 有 多 少 钱 。 如 果 对 手 的 钱 比 我 少 ， 那 么 我 的 钱 
都 没 了 ; 如 果 他 的 钱 更 多 ， 那 么 我 得 到 的 钱 就 比 我 现 有 的 多 。 没 有 任何 信息 表明 
我 们 两 人 之 间 谁 更 富有 ， 这 看 起 来 是 个 不 错 的 游戏 。 现 在 我 们 已 经 学 习 了 期 望 值 
的 知识 ， 不 如 用 它 来 计算 一 下 我 们 的 期 望 收入 吧 。 假 设 我 有 >* 美元 ， 朋 友 有 y 美 
元 ; 我 可 能 失去 x 美元 或 者 获得 y 美元 ， 两 者 的 概率 都 是 1/2， 当 y >x 时 预期 收 
人 为 





























(—x) x1/2+yx1/2=(y-x)/2 
结果 总 是 正 数 。 
看 到 这 个 公式 后 你 觉得 这 个 游戏 对 你 太 有 利 了 ， 毫 不 犹豫 地 接受 了 它 。 当 你 
看 到 对 手 那 副 自 鸣 得 意 的 表情 ， 你 突然 意识 到 他 肯定 也 是 这 样 想 的 ， 所 以 才 跃 跃 
欲 试 。 为 什么 一 个 游戏 对 双方 都 有 利 呢 ? 你 非常 的 困惑 。 
这 个 悖 论 源 于 你 没有 考虑 自己 钱包 中 现金 的 数量 (这 就 是 1/2 产生 的 依据 ) ， 











生活 中 的 概率 趣事 


简单 地 认定 你 赢 和 输 的 是 等 可 能 的 2。 这 显然 是 不 对 的 。 当 你 钱包 里 没有 一 分 钱 
时 ， 除 非 对 手 也 身 无 分 文 ， 你 当然 会 赢 。 当 你 的 现金 很 少时 你 赢 的 概率 就 会 比较 
大 ; 当 你 现金 很 多 时 ， 你 输 的 概率 也 会 比较 大 。 记 住 ,“ 或 者 ”并 不 等 于 一 半 。 

证 我 们 把 这 个 例子 简化 ， 假 设 你 们 各 自 的 现金 数 是 由 扔 硬币 来 决定 的 。 当 正 
面向 上 时 你 有 1 美元 ， 当 反面 向 上 时 你 有 2 美元 。 如 果 你 和 对 手 扔 出 来 的 结果 一 
样 ， 那 么 就 不 产生 输赢 。 如 果 你 扔 出 正面 朝 上 ， 他 扔 出 反面 朝 上 ， 那么 你 赢 了 
1 美元 ; 如 果 你 扔 到 了 反面 而 他 扔 到 了 正面 ， 你 输 给 他 1 美元 。 这 两 种 情况 是 等 
可 能 出 现 的 ， 所 以 你 的 预期 收入 是 0， 此 时 游戏 才 是 公平 的 。 

这 个 例子 非常 简单 ， 让 我 们 来 举 一 个 稍微 复杂 一 点 的 例子 吧 。 假设 你 和 你 的 
对 手 通 过 毛 贷 子 来 决定 各 自 的 现金 数 。 此 时 你 的 预期 收入 是 多 少 呢 ?” 首 先 忽 略 你 
们 两 个 掷 出 同样 大 小 的 平局 。 其 次 ， 在 这 其 中 必然 有 一 个 固定 的 对 称 性 。 比 如 当 
两 人 掷 出 结果 (3，5) (前 一 个 数字 是 你 掷 出 的 大 小 ) 与 (5，3) 的 概率 是 一 样 
的 。 在 前 一 个 情况 中 ， 你 赢得 2 美元 ; 在 后 一 种 情况 中 ， 你 会 输 掉 两 美元 。 每 一 
次 赢 的 钱 都 会 被 等 可 能 出 现 的 另 一 种 情况 输 的 钱 所 抵消 ， 最 后 你 的 预期 收入 又 变 
成 了 0。 这 个 游戏 也 是 公平 的 。 

回 到 最 开始 的 那个 例子 ， 你 和 对 手 拥有 的 现金 数量 并 不 是 由 扔 硬币 或 掷 人 般 子 决 
定 的 。 在 不 同时 候 钱 包 里 的 现金 数量 有 多 少 是 随机 的 。 因 为 你 完全 无 法 预料 在 什么 
时 候 会 付出 多 少 钱 ， 在 什么 时 候 又 会 往 钱 包 里 放 多 少 钱 。 为 了 方便 计算 概率 ， 我 们 
需要 对 可 能 出 现 的 现金 数量 范围 进行 列举 。 经 过 列举 之 后 你 就 会 很 容易 地 发 现 不 论 
范围 有 多 大 ， 概 率 如 何 变 ， 对 于 两 个 玩家 来 说 他 们 的 期 望 收入 都 是 0。 

钱包 悖 论 是 比利时 数学 家 英里 斯 . 克 莱 特 契 克 ( Maurice Kraitchik) 在 他 
1942 年 的 著作 《数学 消遣 》 (Mathematical Recreations) 一 书 中 首次 提出 的 , 但 
原 书 中 举 的 是 领带 的 例子 。 钱 包 的 例子 我 是 在 马丁 . 加 德 纳 1982 年 出 版 的 《 啊 
哈 ! 原来 如 此 》(Ahal Gotcha) 一 书 中 看 到 的 。 这 本 书 介绍 了 一 系列 这 样 的 数学 
谜 题 ， 但 加 德 纳 对 于 钱包 悖 论 显然 没有 把 握 住 实质 。 他 说 : “我 们 2 没有 办 法 用 















































”你 可 能 也 注意 到 了 数学 家 们 都 十 分 喜欢 用 “我 们 ”这 个 词 。 马 克 … 吐 温 把 喜欢 用 这 个 词 的 主体 范 
围 扩 大 到 了 肚子 里 有 绛 虫 的 人 。( 译 者 注 : 马克 吐 温 曾经 写 道 : 只 有 总 统 、 编 辑 和 肚子 里 有 经 
虫 的 人 才 有 资格 使 用 社论 口气 的 “我 们 ”。) 我 个 人 觉得 数学 家 们 有 这 个 喜好 是 因为 他 们 都 觉得 数 
学 是 一 个 孤独 的 事业 ， 所 以 非常 想 要 把 大 家 都 纳入 进来 。 



























































第 5 章 超越 概率 : 你 在 期 待 什么 








任何 简单 的 方法 来 解决 这 个 迟 论 …… 就 连 克 莱特 契 克 都 没有 任何 办 法 。” 但 他 同样 
也 指出 之 所 以 出 现 悖 论 是 因为 每 个 玩家 都 “错误 地 估计 了 自己 启 或 者 输 的 概率 ”。 
正如 我 在 前 一 段 所 说 的 ， 这 就 是 解 开 这 个 悖 论 的 关键 所 在 。 我 在 第 2 章 介 绍 过 ， 加 
德 纳 一 生 都 致力 于 将 数学 知识 传播 给 普通 大 众 这 个 十 分 高 尚且 有 意义 的 工作 。 看 在 
他 的 伟大 事业 的 份 上 ， 我 们 当然 要 忽略 他 在 钱包 悖 论 上 的 这 点 犹豫 不 决 。 

钱包 迟 论 一 开始 会 让 人 感到 困惑 ， 但 是 我 们 最 终 解决 了 它 。 下 面 介 绍 的 这 个 
迟 论 也 同样 让 人 困惑 ， 但 没有 那么 容易 解决 。 在 你 面前 有 两 个 信封 ， 其 中 一 个 信 
封 里 的 钱 是 另 一 个 信封 里 钱 数 的 两 倍 。 你 随机 选择 一 个 信封 ， 打 开 它 ， 发 现 里 面 
有 100 美元 。 现 在 你 是 决定 留 下 这 个 信封 还 是 换 另 外 一 个 信封 呢 ? 乍 看 起 来 换 一 
个 信封 并 不 能 为 你 增加 任何 收益 ， 但 是 你 仔细 想 想 因 为 你 是 随机 选择 的 ， 所 以 另 
一 个 信封 里 的 钱 一 半 的 可 能 是 50 美元 ， 另 一 半 的 可 能 是 200 美元 。 因 此 ， 换 一 
个 信封 你 要 么 多 得 100 美元 要 么 损失 50 美元 ， 你 的 预期 收入 是 

( -50) x1/2+100x1/2=25 
看 起 来 换 一 个 信封 对 你 是 有 利 的 。 

好 吧 ， 那 你 就 换 一 个 信封 吧 。 有 什么 问题 呢 ? 刚才 假设 第 一 个 信封 里 是 100 
美元 ， 现 在 我 们 用 4 来 代替 你 在 第 一 个 信封 里 发 现 的 钱 ; 那么 另 一 个 信封 里 可 能 
是 4/2 或 2x4， 你 预期 的 收入 是 

( -A)/2x1/2+2xAx1/2=A/4 
那么 换 一 个 信封 对 你 是 有 利 的 ， 那 为 什么 还 要 去 选择 第 一 个 信封 呢 ? 你 只 不 过 随 
便 拿 起 来 然后 立即 就 换 到 另外 一 个 了 ! 等 等 ， 这 样 的 话 另 一 个 信封 不 就 变 成 了 第 
一 个 打开 的 信封 ,然后 你 不 是 又 要 换 一 个 信封 了 吗 ? 但 是 换 过 来 的 这 个 信封 不 就 
是 你 一 开始 随便 拿 起 的 信封 吗 ?………… 

这 个 逻辑 太 混 乱 了 。 肯 定 哪里 出 错 了 ,但 是 错 在 哪里 呢 ? 我 们 来 做 个 试验 ， 
看 看 究竟 发 生 了 什么 。 我 们 把 不 同 的 钱 放 在 两 个 信封 里 ， 然 后 选择 一 个 信封 ， 打 
开 它 ， 再 换 另 外 一 个 信封 。 发 生 什 么 了 呢 ? 从 长 远 来 看 ， 你 赢 的 次 数 与 输 的 次 数 
是 一 样 的 ， 你 赢 的 钱 与 输 的 钱 也 是 一 样 的 。 两 个 信封 ， 两 份 钱 ， 但 是 却 有 三 个 数 
字 : 4/2, 4 和 2x4。 你 在 第 一 个 信封 里 看 到 了 4 美元 ， 却 不 知道 男 一 个 信封 里 
究竟 有 4/2 还 是 2 x4， 似 乎 没有 办 法 把 这 个 问题 转化 为 概率 问题 。 就 像 之 前 提 
到 的 ,“ 或 者 ”并 不 意味 着 等 概率 。 在 这 个 问题 中 , “或 者 ”表示 的 意思 是 要 么 
“0 ~100” 要 么 “100 ~0”， 你 只 是 不 知道 究竟 是 前 者 还 是 后 者 。 
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对 这 个 问题 更 准确 地 描述 是 : 你 面前 的 两 个 信封 里 一 个 信封 中 有 4 美元 ， 另 
外 一 个 信封 有 2 x4 美元 。 如 果 你 随机 选择 一 个 信封 ， 打 开 它 之 后 然后 就 换 了 信 
封 ， 你 收入 4 美元 和 失去 4 美元 的 概率 相等 。 世 界 终于 又 恢复 平衡 了 ， 信 封 难题 
也 没有 什么 好 玩 了 。 





5.4 大 小 非常 重要 ( 长度 和 年 纪 同 样 重要 ) 





随机 选择 一 个 有 和 孩子 的 家 庭 。 通 常 说 来 男女 的 出 生 比 全 是 一 样 的 ， 所 以 一 个 
家 庭 中 有 儿子 和 女儿 的 机 会 也 一 样 。 这 就 意味 着 一 个 男孩 有 姐妹 的 概率 比 有 兄弟 
的 概率 高 。 在 一 个 有 四 个 孩子 的 家 庭 中 ， 平 均 应 当 有 两 个 儿子 和 两 个 女儿 。 在 这 
个 家 庭 中 ， 对 于 每 一 个 男孩 来 说 他 都 有 两 个 姐妹 ， 但 是 只 有 一 个 兄弟 。 但 是 对 于 
这 个 男孩 来 说 ， 剩 下 的 孩子 出 生 的 男女 性 别 比 是 一 半 对 一 半 ， 也 就 是 说 这 个 男孩 
应 当 拥有 兄弟 的 数量 与 姐妹 的 数量 是 相等 的 。 哪 一 种 说 法 是 正确 的 呢 ? 

第 二 种 说 法 是 对 的 。 对 于 男孩 来 说 ， 他 的 姐妹 并 不 会 比 兄弟 多 。 这 个 问题 乍 
一 看 又 像 是 一 个 悖 论 。 如 果 你 随机 选 一 个 男孩 为 例 ， 他 平均 拥有 的 兄弟 的 数量 和 
姐妹 的 数量 是 一 样 的 ， 但 是 当 你 再 把 这 个 男孩 自己 包括 进来 的 时 候 ， 这 个 家 庭 不 
就 有 更 多 的 儿子 了 吗 ? 是 的 ,但 是 在 这 个 地 方 有 一 点 歧义 。 因 为 以 一 个 家 庭 为 样 
本 和 以 一 个 男孩 为 样本 是 不 一 样 的 。 当 你 选择 以 一 个 男孩 为 例 的 时 候 ， 你 其 实 已 
经 排除 了 那些 只 有 一 个 女儿 的 家 庭 ， 对 应 选择 的 家 庭 至 少 有 一 个 儿子 。 而 平均 说 
来 这 样 的 家 庭 中 的 男孩 会 比 女 孩 更 多 。 一 个 有 两 个 孩子 的 家 庭 ， 孩 子 可 能 的 情形 
是 GG，GB，BG 和 BB。 如 果 随 机 选择 一 个 有 两 个 孩子 的 家 庭 ， 那 么 这 个 家 庭 没 
有 儿子 的 概率 是 1/4 ， 有 一 个 儿子 的 概率 是 /2， 有 两 个 儿子 的 概率 是 1/4。 那 么 
这 个 家 庭 预 期 的 儿子 的 数量 为 

Ox1/4+1x1/2+2x1/4=1 
但 是 如 果 是 以 一 个 男孩 为 样本 ,那么 在 这 个 家 庭 孩子 的 可 能 组 合 为 ， BB ※， 
B※B，B※G，GB※， 所 以 儿子 (包括 这 个 作为 样本 的 男孩 ) 是 一 个 还 是 两 个 的 
概率 是 相等 的 。 此 时 的 期 望 值 为 : 1 x 1/2 +2 x 1/2 =1.5。 当 排除 这 个 指定 的 男 
孩 时 ， 剩 下 的 这 个 0.5 ( 译 者 注 : 1.5 -1) 个 儿子 意味 着 他 的 兄弟 姐妹 是 男 或 者 
是 女 是 等 可 能 的 。 因 此 有 一 个 儿子 的 家 庭 中 剩 下 的 那个 孩子 的 性 别 是 男 或 女 的 概 
率 相 等 。 但 正如 之 前 说 过 的 “平均 面积 ”一 样 ， 这 里 的 “平均 家 庭 ” 在 没有 明 
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示 如 何 选择 样本 的 前 提 之 下 ， 也 不 是 一 个 准确 的 概念 。 假 设 来 自 1000 个 家 庭 的 
孩子 们 都 齐 聚 一 堂 ， 其 中 男孩 和 女孩 的 数量 大 致 会 相等 。 再 假设 另外 一 个 场景 ， 
让 1000 个 男孩 把 他 们 各 自 的 兄弟 姐妹 都 带 到 这 个 屋子 里 来 。 此 时 屋子 里 的 男孩 
要 比 女孩 多 ， 但 是 对 这 些 选 中 的 男孩 来 说 他 们 兄弟 姐妹 中 男女 的 比例 还 是 1: 1， 
并 非 有 更 多 的 姐妹 。 但 是 他 们 各 自 的 家 庭 中 男孩 会 比 女孩 多 。 

如 果 你 一 开始 没有 想 明 白 ， 不 用 担心 ， 还 有 其 他 人 跟 你 一 样 。1869 年 ， 我 
们 的 老 朋友 弗朗西斯 . 高 尔 顿 圳 士 在 他 的 著作 《遗传 的 天 才 》 (Hereditary Gen- 
ius) 一 书 中 提 到 ， 英 国 的 法 官 们 都 是 男性 ， 他 们 来 自 的 家 庭 平 均 有 5 个 孩子 。 
因此 他 错误 地 得 出 结论 ， 这 些 法 官 们 平均 有 2.5 个 姐妹 和 1.5 个 兄弟 。 时 隔 35 
年 之 后 他 意识 到 了 自己 的 错误 。 他 在 1904 年 《自然 》 杂 志 上 发 表 了 《每 一 级 亲 
属 的 平均 数 》 纠 正当 年 的 错误 (这 篇 文章 的 前 一 篇 文章 似乎 更 有 趣 ， 是 动物 学 
家 菲利普 .斯克 莱 特 〈(Philip L. Sclater) 写 的 《中 非 的 巨 林 猪 》) 。 

我 们 用 男孩 或 是 法 官 作 为 样本 ， 而 不 用 一 个 家 庭 作 为 样本 ， 这 就 是 典型 的 大 
小 偏 性 样本 。 让 我 们 继续 深入 研究 有 两 个 孩子 的 家 庭 吧 。 随 机 选择 一 个 这 样 的 家 
庭 ， 那 么 这 个 家 庭 中 男孩 的 数量 可 以 是 0，1 或 者 2， 对 应 的 概率 分 别 是 1/4， 
1/2 和 1/4。 根 据 我 们 在 4.2 节 中 介绍 的 知识 ， 此 时 10，1，2} 的 概率 分 布 为 
11M4，LM2，1M4}。 现 在 我 们 以 一 个 男孩 为 样本 ， 这 时 的 概率 分 布 变 成 了 
10，1/2，1/21  。 有 趣 之 处 就 在 于 这 些 新 的 概率 可 以 用 数值 乘 以 原来 的 概率 分 布 
得 到 . 









































0=0x1/4, 1/2=1 x1/2, 1/2=2x1/4 
换 而 言 之 ， 这 些 概率 的 比例 与 数量 大 小 的 比例 一 样 : 0 个 男孩 的 概率 是 之 前 概率 
的 0 倍 ; 1 个 男孩 的 概率 是 之 前 概率 的 1 倍 ; 2 个 男孩 的 概率 是 之 前 概率 的 2 倍 。 
因此 ， 新 的 概率 分 布 被 称 为 大 小 偏 性 分 布 。 

再 举 一 个 掷 货 子 的 例子 。 可 能 出 现 的 情形 集合 为 11, 2, 3, 4, 5，6} ,每 
一 种 情形 对 应 的 概率 都 是 1/6。 现 在 无 需 掷 仍 子 ， 你 可 以 随机 选择 人 般 子 一 面 。 随 
机 选择 一 个 小 圆 点 ， 然 后 再 选择 这 一 个 圆 点 所 在 的 那 一 面 。 一 个 山子 一 共有 1 + 
2+…+6=21 个 圆 点 。 此 时 可 能 出 现 的 情形 集合 依然 是 11，2，3，4，5，6}| ， 选 中 
的 那个 点 所 在 的 面 朝 上 的 概率 分 布 变 成 了 (1/21，2/21,，…，6/21)， 而 不 是 之 
前 随机 选择 一 面 对 应 的 概率 分 布 (1/6，1/6，…，1/6)。 我们 根据 两 个 孩子 家 庭 
的 例子 ,将 每 一 个 结果 和 原来 对 应 的 概率 分 布 相 乘 从 而 得 到 了 
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(1x1/6, 2x1/6,…, 6x1/6)，, 即 (1/6,2/6,，…，6/6)。 这 并 不 是 标准 的 
概率 分 布 ， 因 为 所 有 概率 相 加 之 和 并 不 等 于 1。 但 是 将 每 个 数字 乘 以 6/21 之 后 ， 
我 们 就 可 以 得 到 随机 选择 的 圆 点 的 概率 分 布 。 这 时 的 概率 也 因为 一 个 因素 的 比例 
改变 了 大 小 。 所 以 天 的 大 小 偏 性 概率 是 原来 的 概率 1/6 乘 以 6 xiv21。 

还 有 一 些 需要 提醒 读者 们 注意 的 。 投 货 子 的 期 望 值 是 21/6 =3.5， 大 小 偏差 
概率 事实 上 就 是 原来 的 概率 乘 以 可 能 出 现 情形 的 数量 再 除 以 期 望 值 ， 即 
1/6 xi3.5。 我 们 来 正式 地 推导 一 下 这 个 人 te le 
值 为 un， 大 小 偏差 概率 为 p;,， 则 ， 当 =1，2，…，6 时 p, =k xpsA4。 新 的 偏差 
概率 分 布 只 需要 用 原来 的 概率 乘 以 kn， I a ile 
过 是 在 我 们 举 的 例子 中 ,恰好 产 都 等 于 1/6, j=3.5。 

假设 你 随机 选择 美国 一 个 州 ， 记 录 两 项 数据 : 中 这 个 州 美 国 参议 员 的 数 
量 ， 包 该 州 美国 众 议 员 数量 。 因 为 美国 每 个 州都 有 两 个 参议 员 ， 但 是 每 个 州 
众 议 员 的 数量 则 是 由 每 个 州 的 人 口 决 定 的 ， 所 以 情形 中 之 下 每 个 州 是 一 样 
的 ， 但 情形 @ 却 是 一 个 大 小 偏 性 样本 。 如 果 你 想 要 每 个 州 概率 相同 ， 那 么 就 
不 能 选择 以 众 议 员 为 样本 ; 如 果 你 更 偏向 于 人 口 大 州 ， 那 么 就 选择 众 议 员 ， 
样本 。 有 时 你 可 能 会 错误 地 选择 了 大 小 偏 性 样本 ， 但 另 一 些 时 候 这 些 偏 性 样 
本 又 恰恰 符合 你 的 要 求 。 很 多 现实 中 的 例子 都 说 明了 这 个 问题 。 随 机 选择 一 
个 人 进行 民意 调查 ， 调 查 对 象 来 自 一 个 人 口 较 多 的 家 庭 的 概率 更 大 ， 她 更 可 
能 住 在 人 口 密集 的 城市 ， 上 的 学 校 也 比 正常 规模 学 校 大 ， 在 一 个 大 规模 公司 
工作 等 等 ， 这 些 因素 都 会 影响 到 她 的 社会 观点 。 当 鱼 类 研究 者 钓 了 一 条 
( 译 者 注 : 想 知 道 这 条 鱼 属 于 哪 一 种 鱼 群 ) ， 鱼 群 的 范围 越 大 越 容 易 归 类 。 动 
物 成 群 出 现 的 时 候 就 容易 发 现 ， 例 如 ， 鸟 群 、 成 批 的 青蛙 以 及 大 量 的 水 母 
群 。 当 人 们 从 空气 中 检测 树林 里 的 树木 病害 时 ， 树 干 上 长 的 大 面积 斑 块 更 容 
易 被 发 现 ; 大 肿瘤 更 容易 在 做 扫描 或 X 光 检 查 时 检查 出 来 。 这 样 的 例子 不 胜 
数 举 ， 它 们 都 说 明了 大 小 非常 的 重要 。 

有 很 多 家 庭 都 去 参观 美国 黄石 国家 公园 ， 公 园 里 最 著名 的 就 是 老 忠 实 喷泉 
( Old Faithful Geyser) ， 它 每 次 喷 水 都 非常 准时 ， 差 不 多 每 90 分 钟 就 会 喷 一 次 。 
我 们 随机 选择 一 个 家 庭 作为 样本 。 当 这 个 家 庭 到 达 时 ， 预 计 还 要 等 45 分 钟 喷泉 
on etd a md 
谈 。 这 个 人 记录 的 等 待 时 间 比 45 分 钟 要 长 。 他 告诉 这 一 家 人 ， 这 意味 着 喷泉 间 
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歇 的 时 间 越 来 越 长 。 但 是 从 公园 巡查 员 那 里 得 到 的 数据 却 并 没有 支持 这 样 的 结 
论 。 那 么 是 这 个 人 的 运气 不 好 吗 ? 还 是 有 其 他 合理 的 解释 ? 

当然 有 ! 关键 在 于 “ 老 忠 实 ” 和 名不副实 ， 它 并 不 是 每 次 都 是 恰好 间隔 90 
分 钟 喷发 的 。 这 90 分 钟 也 只 是 一 个 平均 数 。 事 实 上 ， 间隔 时 间 在 30 分 钟 和 
2 小 时 之 间 浮 动 ， 但 大 部 分 情况 下 是 在 60 分 钟 和 90 分 钟 之 间 浮 动 。 如 果 这 个 
喷泉 是 严格 按照 每 90 分 钟 一 次 的 频率 喷发 ， 当 你 随机 到 达 喷 泉 边 时 ， 你 平均 
需要 等 待 的 时 间 的 期 望 值 就 肯定 是 45 分 钟 了 。 但 是 现在 这 个 间隔 时 间 是 在 译 
动 的， 很 可 能 你 到 达 的 时 候 是 喷泉 喷发 间隔 时 间 长 的 那 一 段 ， 此 时 你 需要 等 待 
的 时 间 就 超过 45 分 钟 了 。 为 了 简化 这 个 问题 ， 我 们 假设 间隔 的 时 间 要 么 是 一 
个 小 时 要 么 是 两 个 小 时 。 所 以 当 喷 泉 在 正午 时 喷发 了 ， 之 后 就 会 在 下 午 2 点 、 
3 点 、5 点 、6 点 …… 喷 发 。 此 时 间隔 的 平均 时 间 是 90 分 钟 。 如 果 你 随机 在 某 
一 个 时 刻 到 达 ， 你 在 两 小 时 间隔 之 间 到 的 概率 是 在 一 小 时 间隔 中 到 达 的 两 倍 ， 
此 时 你 的 预期 等 待 时 间 是 一 小 时 。 而 当 你 在 一 小 时 间隔 之 间 到 达 时 ， 你 的 预期 
等 待 时 间 是 半 个 小 时 。 所 以 在 273 的 情况 下 ， 你 平均 需要 等 一 个 小 时 ; 而 在 剩 
下 的 173 的 情况 下 ,你 需要 等 待 半 个 小 时 。2/3 x1+1/3 x1/2 =5/6， 所 以 你 
的 等 待 是 5/6 个 小 时 ， 即 50 分 钟 ， 比 平均 间隔 时 间 90 分 钟 的 一 半 45 分 钟 稍 
微 长 一 些 。 图 5-1 形象 地 说 明了 这 个 计算 过 程 。 从 图 中 可 以 看 出 ， 你 在 2 小 时 
的 间隔 中 到 达 的 机 会 更 高 ， 所 以 平均 等 待 时 间 才 会 比 45 分 钟 要 长 。 现 实 中 的 
浮动 带 来 的 不 可 预测 性 比 我 们 之 前 作出 的 假设 要 高 得 多 ， 假 设 的 例子 让 你 知道 
了 整个 问题 应 当 如 何 解决 。 


kx X-X- 发 一 -十 天 - 尖 | 关 二 天 一 天 一 关上 
Noon 2:00 3:00 5:00 6:00 8:00 


5-1 老 忠 实 喷泉 每 次 喷发 间隔 的 时 间 在 1 小 时 到 2 小 时 之 间 


以 上 介绍 的 就 是 著名 的 概率 问题 一 一 等 待 时间 悖 论 的 一 个 例子 。 等 待 时 间 人 悖 
论 的 另外 一 个 例子 就 是 你 随机 到 达 公 交 站 需要 等 公交 的 时 间 。 即 使 公交 车 平均 每 
小 时 两 趟 ， 但 是 由 于 随机 变化 ， 你 到 达 公交 站 的 时 候 很 可 能 就 是 长 间隔 的 那 段 时 
间 ， 所 以 你 等 待 的 时 间 会 比 严格 按时 运营 需要 等 待 的 15 分 钟 长 。 公 交 车 的 运营 
相对 来 说 是 比较 有 规律 的 ， 所 以 期 间 的 间隔 浮动 并 不 大 。 我 们 在 第 3 章 介绍 的 那 
些 稀少 无 法 预测 的 事件 才能 真正 诠释 “ 停 论 ”一 词 。 以 地 震 为 例 ， 根 据 美国 地 
质 调查 局 的 数据 ， 全 世界 平均 每 年 发 生 一 次 大 地 震 (里 氏 震 级 八 级 或 更 高 )。 考 
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虑 到 地 震 变化 无 常 ， 我 们 同意 将 地 震 这 个 事件 定性 为 “稀少 且 无 法 预测 ”。 但 这 

意味 着 不 管 之 前 的 地 震 什 么 时 候 发 生 ， 下 一 次 大 地 震 发 生 的 等 待 时 间 期 望 值 还 
是 一 年 。 所 以 如 果 外 星人 决定 要 秘密 访问 地 球 ， 它 可 以 预期 下 一 次 发 生 大 地 震 要 
等 一 年 。 男 一 方面 ， 它 到 达 地 球 的 时 间 正 好 距离 上 一 次 地 震 一 年 。 距 上 次 地 震 一 
年 ， 距 下 一 次 地 震 还 是 一 年 ， 但 两 次 地 震 相 隔 的 是 一 年 而 不 是 两 年 啊 ! 这 看 起 来 
是 一 个 悖 论 ， 但 是 请 读者 们 记 住 这 些 都 只 是 期 望 值 。 我 们 的 外 星人 朋友 只 是 恰好 
到 来 的 时 间 所 处 的 间隔 比 平常 的 间隔 要 长 。 那 些 将 平均 期 望 值 拉 低 的 短 间隔 被 完 
全 忽略 了 。 

等 待 时 间 悖 论 与 大 小 偏 性 样本 有 许多 共同 点 。 为 了 简化 老 忠 实 喷泉 的 例子 ， 
我 们 将 喷发 间隔 时 间 变 成 1 小 时 或 2 小 时 。 那 么 随机 选择 的 间隔 样本 可 以 是 两 者 
中 的 任何 一 个 ,间隔 时 长 的 预期 值 变 成 了 90 分 钟 。 当 你 随机 走 到 喷泉 边 上 时 ， 
这 个 间隔 的 时 间 是 2 小 时 间隔 的 概率 是 1 小 时 间隔 的 两 倍 。 所 以 集合 |30，60| 
(分 钟 ) 的 概率 分 布 由 (1/2，1/2) 变 成 (1/3 ，2/3 ) ， 大 数值 占 的 比率 更 高 了 。 
我 们 可 以 注意 到 新 概率 可 以 用 原来 的 概率 乘 以 间隔 的 长 度 得 出 。 所 以 这 个 新 的 分 
布 是 大 小 偏 性 的 ， 更 准确 地 说 是 长 度 偏 性 的 。 这 是 一 个 简化 的 例子 ,但 是 不 管 真 
实 的 时 间 间 隔 是 如 何 分 布 的 ， 当 你 随机 走 到 喷泉 边 时 所 处 的 这 个 间隔 的 概率 比例 
是 与 时 间 长 度 相 关 的 。 

预期 寿命 的 计算 过 程 中 也 包含 偏差 概率 。 用 数学 语言 来 描述 预期 寿命 是 指 
新 出 生 的 个 体 预期 的 生命 期 限 。 在 人 口 问题 中 ， 预 期 寿命 是 通过 记录 死者 的 寿 
命 (以 年 为 单位 ) ， 然 后 再 取 平 均值 得 到 的 。《 宋 飞 正 传 》 中 有 一 集 叫 做 “ 花 
洒 ”。 乔 治 . 科斯 坦 萨 告诉 他 的 父母 佛罗里达 州 的 预期 寿命 是 81 岁 ， 而 他 们 居 
住 的 纽约 皇后 区 的 预期 寿命 只 有 73 岁 ， 试 图 说 服 他 的 父母 搬 去 佛罗里达 州 。 
弗兰克 和 埃 斯 特 尔 应 该 为 了 能 多 活 8 年 而 搬 去 佛罗里达 州 吗 ? 他 们 并 不 需要 。 
佛罗里达 州 人 们 的 预期 寿命 那么 高 的 一 个 原因 (排除 人 们 都 喝 橘 眷 这 个 原因 ) 
在 于 许多 人 从 其 他 州 搬 来 了 这 里 ， 其 中 大 部 分 人 都 是 从 纽约 来 的 。 因 为 搬 来 这 
里 的 人 们 都 期 望 能 活 得 更 长 ， 所 以 他 们 在 年 长 之 后 才 搬 来 佛罗里达 州 。 所 以 他 
们 “剥夺 ”了 佛罗里达 州 人 民 在 年 轻 时 死去 的 权利 ， 这 也 就 提高 了 平均 死亡 年 
龄 。 这 种 情况 对 于 净 移 民 的 城市 、 州 或 者 国家 来 说 非常 典型 ， 其 中 一 个 著名 的 
例子 就 是 以 色 列 (这 里 也 有 很 多 橘子 ) 。 而 那些 净 移 民 出 境 的 州 来 说 ， 预 期 寿 
命 相 对 会 比较 低 。 为 了 有 助 于 读者 理解 ， 考 虑 一 个 极端 的 情况 。 假 设 A 小 镇 上 
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所 有 的 人 要 人 么 在 40 岁 的 时 候 去 世 ， 要 人 么 在 80 岁 的 时 候 去 世 。 人 们 如 果 活 过 了 
40 岁 这 个 门槛 ,在 65 岁 退 休 之 后 就 会 搬 去 另外 一 个 B 小 镇 度 过 余生 。 那 么 A 
小 镇 的 预期 寿命 就 是 40 岁 ， 而 B 小 镇 则 是 80 岁 。 引 进 预 期 寿命 中 一 个 更 为 现 
实 的 可 变 因素 和 移民 年 纪 后 ， 你 得 到 的 结果 可 能 没有 这 么 戏剧 性 ， 但 是 效果 
相同 。 


5.5 偏差 行为 


让 我 们 重新 坐 回 轮 盘 赌 桌 上 .9 除了 对 单一 数字 下 注 外 ， 还 有 很 多 方法 可 以 
对 一 组 数字 下 注 。 在 轮 盘 赌 旧 上， 数字 1 ~ 36 分 布 在 3 x12 的 网 格 中 ， 顶 排 是 
1-2-3， 第 二 排 是 4-5-6， 以 此 类 推 。 这 些 数字 一 半 是 红色 的 ， 一 半 是 黑色 的 。 
在 网 格 的 顶端 是 绿色 的 数字 0 和 00 (这 是 在 美式 轮 盘 上 ， 欧 洲 轮 盘 没有 00 ) 。 
在 一 个 数字 上 投注 称 为 单一 数字 。 比 如 你 可 以 下 注 奇 数 ， 虽 然 投注 方式 奇特 ， 
但 只 要 出 现任 何 奇数 如 1，3，…，35 时 你 就 赢 了 。 同 样 ， 你 也 可 以 投注 偶数 
或 者 红 黑 任 一 色 。 其 他 投注 方式 还 有 两 个 、 三 个 、 方 格 和 纵 列 等 数字 组 合 方 
式 。 这 是 赌场 术语 ， 它 的 意思 是 你 可 以 将 筹码 下 在 至 少 一 个 数字 上 ， 当 符合 要 
求 的 数字 出 现时 你 都 可 以 赢 。 考 庸 置 疑 ， 你 选 的 数字 越 多 ， 赢 取 的 金额 越 少 。 
经 过 仔细 计算 会 发 现 这 个 游戏 不 管 你 怎么 下 注 ， 平均 每 一 美元 都 会 损失 五 美 
分 。 让 我 举 个 例子 ,假设 你 对 奇数 下 注 ， 一 注 的 彩 金 是 1 美元 , 1 ~36 中 有 18 
个 奇数 ， 你 赢 取 1 美元 的 概率 是 18/38， 还 有 20/38 的 概率 会 输 掉 全 部 的 赌注 。 
你 可 以 期 待 的 收益 如 下 : 

1 x18/38 + ( -1) x20/38 = -2/38~ -0.05 

每 1 美元 可 预期 的 损失 是 5 美 分 ， 和 单一 数字 下 注 一 样 。 奇 数 下 注 和 单一 数字 
比 ， 赢 的 概率 要 高 出 许多 ， 但 彩 金 相 比 也 少 很 多 。 换 而 言 之 ， 此 时 你 的 钱 的 变异 性 
比 单一 数字 下 注 大 得 多 。 期 望 值 不 能 反映 出 这 一 事实 ， 所 以 最 好 有 一 种 方式 来 测试 
变异 性 ， 即 测试 实际 价值 偏离 期 望 值 的 程度 大 小 。 有 很 多 方法 都 可 以 实现 ， 但 概率 




















G ”我 现在 正 用 各 种 博彩 的 小 提示 引起 你 们 的 好 奇 心 。 读 者 们 再 耐心 等 等 ， 到 第 7 章 时 我 们 就 可 以 完 
全 沉浸 在 各 种 游戏 、 下 注 和 博彩 的 世界 中 了 。 
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学 家 和 统计 学 家 一 致 认同 最 好 的 方法 是 方差 。 方 差 的 定义 是 实际 值 与 期 望 值 之 差 平 
方 的 期 望 值 O 看 上 去 非常 的 抛 口 。 让 我 以 轮 盘 赌 的 奇数 下 注 为 例 解释 一 下 。 收 入 
期 望 值 是 -0.05 (美元 )， 两 个 可 能 的 实际 值 是 -1 和 1。 两 者 之 差分 别 是 -1 - 
(-0.5) = -0.95 和 1-(-0.5) =1.05, 平方 即 ( -0.95)” =0.9025 和 1.05” = 
1. 1025。 最 后 我 们 需要 计算 这 些 差 平方 的 期 望 值 。 第 一 种 情况 下 输 的 概率 是 20/38， 
第 二 种 情况 下 赢 的 概率 是 18/38。 两 者 平方 的 期 望 值 的 方差 即 为 
0. 9025 x20/38 +1. 1025 x18/38~=1 

这 个 数字 本 身 可 能 不 能 说 明 什 么 ,但 当 我 们 把 它 和 单一 数字 比较 时 就 会 发 现 问 
题 。 可 能 的 实际 值 是 -1 和 35， 同 样 利 用 上 述 的 计算 方法 可 得 出 方差 约 为 33。 在 
单一 数字 下 注 的 方差 远 远 大 于 在 奇数 上 下 注 的 方差 .反映 出 单一 数字 中 财富 变动 
较 大 。 从 长 期 看， 任何 一 种 下 注 方式 输 得 都 差不多 ， 只 是 输 的 方式 是 不 同 的 。 

方差 有 效 地 补充 了 期 望 值 的 不 足 。 再 举 男 一 个 例子 ， 也 是 永恒 的 话题 一 一 天 
气 。2006 年 上 半年 ， 美国 两 座 城市 ( 阿 克 塔 和 底特律 ) 分 别 因为 不 同 的 原因 吸 
引 了 我 。2006 年 1 月 ,我 去 了 南 加 州 的 海岸 城市 阿 克 塔 旅行 。 浏 览 过 它 的 一 些 天 
气 统计 资料 后 ， 我 计算 出 日 平均 气温 是 59 华氏 度 。 几 个 星期 后 ， 第 四 十 届 超 级 
碗 比赛 在 底特律 举办 ， 底 特 律 的 日 均 气 温 也 保持 在 59 华氏 度 。 一 年 中 随机 选取 
一 天 去 阿 克 塔 和 底特律 ， 可 期 望 的 日 气温 同样 是 59 华氏 度 。 然 而 ， 增 加 了 方差 
后 就 有 了 更 多 的 含义 ， 阿 克 塔 和 底特律 的 方差 分 别 为 12 和 363 (我 很 怀疑 还 能 
找到 比 阿 克 塔 的 温度 方差 更 小 的 地 方 )。 底 特 律 的 方差 大 得 多 ,说 明 一 年 的 温度 
变化 较 大 。 例 如 底特律 一 月 的 日 均 气 度 是 33 ( 译 者 注 : 后 文 作 者 省 略 了 温度 的 
单位 一 一 华氏 度 ) ， 六 月 是 85 ， 而 阿 克 塔 一 月 和 六 月 的 日 均 温 度 分 别 是 55 和 63。 
去 底特律 ， 你 需要 根据 季节 带 上 短 袖 或 长 衣 裤 ， 在 阿 克 塔 这 些 衣服 就 都 没什么 用 
处 了 (只 要 记得 冬天 带 雨 侈 就 行 ) 。 

我 之 前 提 到 过 对 于 方差 值 尚 无 明确 定义 ， 一 个 原因 就 是 它 是 在 平方 值 上 进行 
计算 的 ， 这 意味 着 计量 单位 也 被 平方 了 。 方 差 是 33 平方 美元 或 者 363 平方 度 ， 
是 什么 意思 ? 显然 没有 意义 ， 但 有 一 个 简单 的 解决 方法 : 计算 方差 的 平方 根 。 这 


















































”因为 我 们 希望 获得 正 值 ， 所 以 去 计算 平方 。 另 一 种 方法 是 计算 实际 值 和 期 望 值 之 间 的 绝对 值 ( 即 去 
除 符号 的 差异 ) ， 不 过 平方 被 证 明 比 绝对 值 具 有 更 适合 的 数学 特征 ， 例 如 ， 在 一 些 限制 条 件 下 ， 方 
差 和 期 望 值 一 样 都 具有 可 加 性 ， 而 使 用 绝对 值 就 不 可 能 有 这 样 的 效果 。 
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被 称 为 标准 差 ， 因 保留 了 计量 单位 而 更 具 意义 。 在 轮 盘 赌 桌 的 示例 中 ， 单 一 数字 
和 奇数 下 注 的 标准 差分 别 为 1 美元 和 v33 二 5.7 美元 。 在 天 气 示 例 中 ， 阿 克 塔 和 
底特律 的 标准 差分 别 为 3.5 华氏 度 和 19 华氏 度 。 

这 样 就 感觉 正常 多 了 ， 但 标准 差 仍 然 没 有 像 期 望 值 一 样 透 彻 明白 地 解释 问题 。 
有 一 些 规 则 和 结果 可 能 有 用 ， 其 中 之 一 必须 归功 于 伟大 的 俄国 数学 家 切 比 雪夫 
(Pafnuty Lvovich Chebyshev) (1821 一 1894) 。 他 在 概率 、 分 析 、 力 学 以 及 最 重要 的 
数论 上 做 出 过 突出 贡献 ， 并 因此 而 闻名 。9 他 的 重要 成 果 切 比 雪夫 不 等 式 阐 述 了 在 
任何 试验 中 ,不论 为 何 值 ， 如 果 期 望 值 的 标准 差 为 K， 则 概率 必须 至 少 为 1 - 
1 大 。 例 如 ， 在 任何 试验 中 当天 =2 时 ， 概 率 至 少 为 0.75。 换 而 言 之 切 比 雪夫 不 
等 式 告诉 我 们 ， 在 重复 试验 中 至 少 75% 的 结果 会 落 在 两 个 平均 标准 差 之 间 。 在 
阿 克 塔 ， 我 们 可 以 期 望 至 少 273 天 的 日 均 气温 在 52 ~ 66 华氏 度 之 间 。 而 在 底 特 
律 ， 则 可 以 期 望 至 少 273 天 的 日 均 气 温 在 21 ~97 华氏 度 之 间 。 当 =3 时 ， 可 得 
1-1/k” =8/9 守 0. 89， 即 至 少 89% 的 观测 值 会 在 期 望 值 的 三 个 标准 差 之 间 。 

需要 强调 的 是 切 比 雪夫 不 等 式 中 “至 少 ” 的 含义 。 因 为 现实 中 的 概率 和 百 
分 比 通常 高 得 多 。 例 如 ， 轮 盘 赌 中 的 奇数 下 注 ， 所 有 的 观测 值 都 在 两 个 标准 差 之 
间 。 记 住 ， 如 果 选 择 k=1， 那 么 切 比 雪夫 告诉 你 的 就 是 至 少 0% 的 观测 值 会 在 一 
个 标准 差 中 。 这 显然 是 对 的 ， 却 毫 无 意义 。 此 时 切 比 雪夫 不 等 式 往 往 会 显得 粗 
料 ， 但 这 却 是 不 可 避免 的 ， 因 为 不 论 实验 的 内 容 是 什么 它 永远 保持 真实 性 。 这 就 
有 点 像 是 说 美国 任何 一 个 州都 小 于 572000 平方 英里 。 我 们 还 需要 把 阿拉 斯 加 州 
也 包括 进来 。 当 只 考虑 美国 大 陆 的 话 那么 就 是 真 的 ， 但 只 说 262000 平方 英里 会 
更 恰当 。 当 然 如 果 限 制 到 更 小 的 新 英格兰 地 区 ， 就 只 需要 更 小 的 面积 了 。 尽 管 存 
在 上 述 缺陷 ， 在 下 一 节 我 们 就 会 发 现 切 比 雪夫 不 等 式 大 有 用 处 。 

说 了 这 么 多 实际 的 例子 那些 理论 主义 者 大 概 已 经 受 尽 折磨 了 ， 现 在 我 就 为 方 
差 下 一 个 形式 定义 。 假 设 试验 的 结果 为 x, ，x,，…， 对 应 的 概率 为 p, ，p,，…。 
这 与 我 们 之 前 给 期 望 值 下 定义 时 作出 的 假设 是 一 样 的 。 令 期 望 值 为 ,计算 每 个 









































© 切 比 雪夫 还 保持 着 数学 界 一 项 非 官 方 的 纪录 最 多 姓氏 拼写 的 方式 。 严 格 说 来 应 该 是 姓氏 音译 
的 方式 最 多 。 因 为 在 他 的 母语 斯 拉夫 语 中 ， 他 的 姓氏 只 是 He6uzoés 这 一 种 。 但 在 西方 世界 的 语言 
中 ， 他 的 名 字 有 许多 不 同 的 音译 方式 ， 从 最 简单 的 西班牙 语 的 版 本 Cebysev 到 最 为 复杂 的 德语 版 
本 Tschebyschedff。 
























































生活 中 的 概率 趣事 


可 能 值 和 jw 之 间 差 的 平方 ， 再 计算 这 些 差 的 平方 的 期 望 值 。 将 以 上 文字 描述 转化 
为 数学 公式 ， 就 得 到 了 方差 的 形式 定义 ,通常 用 o (希腊 字母 o 的 平方 ) 表 示 
0 = (x -1K) xpi + (% -HM) Xp + 
如 果 可 能 发 生 的 情形 是 有 限 的 ,那么 总 和 最 后 会 停止 相 加 ， 和 否则 将 会 永远 继续 。 
你 可 以 用 我 们 之 前 计算 轮 盘 游戏 时 得 出 的 结论 来 验证 一 下 这 个 公式 。 让 我 们 用 掷 
骨 子 的 例子 来 作为 练习 吧 。 掷 出 来 的 数字 可 能 是 1，2，…，6， 每 个 数字 出 现 的 
概率 都 是 1/6， 期 望 值 是 3. 5 ， 于 是 方差 为 
(1 -3.5)* x1/6+(2-3.5)* x1/6+:…+(6-3.5)’ x1/6~2.9 
那么 标准 差 就 是 1.7。 现 在 有 一 颗 骨 子 三 个 面 是 1 另外 三 个 面 是 6， 通 过 计算 来 
比较 这 两 个 骨 子 的 标准 差 。 此 时 骨 子 的 可 能 值 只 有 1 或 6， 每 个 的 概率 是 1/2， 期 
望 值 是 3. 5， 方 差 为 
(1 -3.5)* x1/2+(6-3.5) x1/2=6.25 

标准 差 即 为 2.5， 这 比 普通 的 骨 子 标准 差 大 。 因 为 这 个 特别 角 子 的 结果 倾向 于 偏 
离 期 望 值 3. 5。 这 个 例子 又 表明 期 望 值 并 不 能 说 明 全 部 ， 标 准 差 对 其 构成 了 有 效 
的 补充 。 

回想 一 下 标准 差 是 方差 的 平方 根 ， 设 为 oa， 现在 我 们 可 以 用 公式 写 出 切 比 雪 
夫 不 等 式 。 但 在 这 之 前 ， 让 我 引进 概率 上 的 另外 一 个 重要 概念 。 试 验 之 前 ， 结 果 
都 是 未 知 的 ， 令 其 为 X。 这 就 表示 站 在 试验 之 前 未 知 ， 试 验 之 后 会 得 到 一 个 数 
值 。 这 个 未 知 量 的 值 由 一 些 试验 的 随机 性 决定 ， 它 被 称 为 随机 变量 。 这 是 概率 中 
一 个 非常 重要 的 概念 ， 它 大 大 简化 了 示例 中 的 记 数 。 如 果 掷 骨 子 ， 就 不 用 写 “ 掷 
到 5 的 概率 ”和 “ 掷 到 6 的 概率 ”， 我 们 首先 可 以 设 掷 出 来 仍 子 的 结果 为 并 ， 然 
后 直接 写作 P(X=5) 和 P(X=6)， 这 样 更 加 准确 也 更 加 方便 。 切 比 雪夫 不 等 式 
现在 可 以 表示 为 








Pl(u-kxo<X<n+kxo)=1 -1/k’ 
或 者 用 绝对 值 标示 

P(|X-u|<kxo)=1 -1/k’ 
其 中 可 为 任何 值 (不 必 是 整数 ， 可 以 是 1.5 或 4.26 或 者 其 他 的 非 负数 ) 。 确 保 最 
后 两 个 公式 是 相等 的 ， 并 且 和 我 之 前 给 出 的 切 比 雪夫 不 等 式 的 文字 表述 相 一 致 。 





第 5 章 超越 概率 : 你 在 期 待 什么 


5.6 结语 


我 们 在 这 一 章 介 绍 的 期 望 值 的 概念 可 以 被 认为 是 随机 试验 中 的 理想 平均 值 。 
期 望 值 将 试验 总 结 成 了 一 个 数字 ， 但 是 通过 众多 例子 我 们 知道 在 解释 这 个 数字 的 
时 候 必须 要 小 心 谨 慎 。 伴 随 着 期 望 值 的 是 标准 差 ， 它 是 用 来 衡量 试验 中 值 的 变化 
的 。 标 准 差 、p 和 o 这 三 个 量 可 以 快速 地 总 结 任何 随机 试验 。 我 在 这 一 章 中 也 暗 
示 过 几 次 ， 可 以 通过 长 期 平均 数 来 解释 期 望 值 。 在 下 一 章 中 我 们 将 全 面 地 研究 这 
种 方法 。 
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两 个 迷人 的 数学 结论 


































































































大 数 定律 和 中 心 极限 定理 是 概率 论 的 两 大 基石 ， 它 们 相辅相成 地 解释 了 在 长 


它们 将 这 个 纷繁 复杂 的 世界 变 得 更 












































为 中 均值 和 相对 频率 的 变化 规律 。 也 正 是 
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第 6 章 必然 概率 : 两 个 迷人 的 数学 结论 


6.1 木 已 成 舟 ， 反 反复 复 


在 第 5 章 的 开始 我 提 到 了 随 着 次 数 的 不 断 增 加 ， 反 复 投 货 子 得 到 的 平均 值 会 
越 来 越 趋 近 于 3. 5S。 当 我 在 写 下 这 段 话 时 ， 我 希望 读者 们 认为 它 是 合理 的 。 如 果 
你 属于 万 事 都 要 怀疑 的 类 型 ， 你 可 以 自己 慢 慢 尝 试 。 在 第 1 章 中 我 解释 了 扔 硬币 
时 正面 朝 上 的 概率 是 0.5: 在 大 量 反 复 扔 硬币 的 试验 中 你 可 以 预测 到 其 中 大 概 一 
半 的 时 候 都 是 正面 朝 上 。 正 面 朝 上 的 比例 接近 概率 。 至 少 在 上 述 例子 中 似乎 概率 
和 期 望 值 都 可 以 通过 平均 长 期 行为 来 解释 。 我 们 很 容易 相信 这 些 解释 在 其 他 例子 
中 也 是 可 行 的 。 看 到 我 们 的 理论 能 够 如 此 完美 地 解释 现实 世界 ， 倍 感 欣慰 。 现 在 
我 们 学 习 了 这 么 多 概率 的 知识 ， 这 种 直觉 意义 上 的 感性 解释 已 经 不 够 了 。 我 们 需 
要 拿 出 数学 上 的 铁证 来 证 明 期 望 值 和 平均 数 类 似 ， 比 例 与 概率 类 似 。 幸 运 的 是 ， 
这 些 都 能 通过 我 们 学 习 的 知识 得 到 证 明 。 

要 证 明 这 些 我 们 必须 先 做 出 合理 的 假设 。 比 如 : 不 由 概率 学 家 们 来 扔 硬币 ， 
魔术 师 佩 尔 西 : 戴 康 尼斯 也 不 行 。 他 可 是 具有 每 次 让 硬币 正面 朝 上 (有 时 甚至 可 
以 让 硬币 消失 ) 的 超 能 力 2? 。 但 只 要 我 们 准确 地 描述 了 这 些 试验 ， 并 将 每 种 可 能 
出 现 的 情况 的 概率 计算 出 来 ， 我 们 就 处 于 概率 、 数 学 和 逻辑 的 世界 了 。 接 下 来 我 
们 要 证 明 一 个 概率 中 最 基本 的 理论 : 大 数 定 律 ， 也 被 称 为 均值 定律 。 

在 正式 描述 之 前 ， 我 先 来 介绍 大 数 定律 在 试验 中 发 挥 的 作用 。 在 图 6-1 中 面 
出 了 在 一 系列 投 骨 子 的 试验 中 连续 平均 数 (计算 机 模拟 的 试验 ) 。 第 一 次 括 出 的 
是 5， 所 以 第 一 次 的 平均 数 就 是 5。 第 二 次 掷 出 了 3 ， 所 以 前 两 次 的 平均 数 就 是 
(5+3)/2 =4; 第 三 次 掷 出 了 3 ， 所 以 前 三 次 的 平均 数 是 (5 +3 +3)/3 二 4.3; 接 
下 来 又 掷 出 了 4 和 3， 因 此 平均 数 变 成 了 3.75 和 3.6， 以 此 类 推 。 我 们 很 惊讶 地 
发 现 很 快 平均 数 就 向 3. 5 靠近 ， 一 开始 的 浮动 是 非常 正常 的 。 第 一 次 掷 出 的 数字 









































G@ 戴 康 尼斯 是 概率 界 的 一 个 传奇 。 在 14 岁 的 时 候 ， 他 辍学 之 后 离 家 出 走 ， 和 另 一 个 魔术 师 行 走 江 
湖 。 在 理解 了 许多 魔术 的 技巧 和 赌场 游戏 之 后 ， 他 开始 对 概率 产生 浓厚 的 兴趣 。24 岁 的 时 候 ， 他 
开始 白天 表演 魔术 ， 晚 上 在 纽约 城市 大 学 上 夜校 。 五 年 之 后 ， 他 拿 到 了 哈佛 大 学 的 博士 学 位 。 他 

现在 是 斯 坦 福 大 学 的 一 名 教授 ， 也 是 概率 统计 领域 最 多 产 的 一 位 学 者 。 提 醒 读者 们 注意 : 没有 高 

中 学 历 也 是 可 以 有 很 大 成 就 的 。 





















































生活 中 的 概率 趣事 


可 以 是 1 到 6 之 间 的 任意 一 个 数字 ， 所 以 刚 开 始 的 时 候 是 非常 难以 预测 的 ， 随 后 
偏差 就 会 迅速 变 小 。 比 如 100 次 之 后 平均 数 在 3 和 4 之 间 的 概率 就 超过 
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图 6-1 投 般 子 试验 的 连续 平均 数 
(期望值 3.5 用 虚线 表示 ) 


你 可 以 注意 到 在 图 6-1 左 图 中 大 概 第 180 次 左右 有 一 个 很 小 的 平均 值 下 降 。 
大 概 在 160 次 到 180 次 之 间 掷 出 的 数字 有 很 多 1 和 2， 所 以 拉 低 了 平均 值 ， 这 纯 
属 巧合 。 图 6-1 的 右 侧 图 是 统计 了 5000 次 试验 的 结果 。 在 这 幅 图 中 第 180 次 左 
右 的 变动 就 很 难看 出 来 。 像 第 160 次 到 第 180 次 之 间 连 续 20 次 的 数字 变动 在 
5000 次 试验 的 整体 结果 中 就 没有 明显 地 影响 了 。 

上 面 这 个 例子 表明 了 连续 平均 数 是 如 何 稳定 在 期 望 值 附 近 的 。 而 对 应 地 ， 用 
扔 硬币 的 例子 来 说 明 比 例 或 相关 频率 是 如 何 稳定 在 概率 附近 的 。 我 们 连续 扔 五 次 
硬币 ,得 到 TTHTH 的 结果 。 前 五 次 正面 朝 上 的 相对 频率 为 0,，0，1/3,，1/4 和 
2/5， 用 小 数 形式 表示 为 0，0，0.33,0.25 和 0.4。9 得 到 概率 0.5 并 没有 什么 特 
殊 之 处 。 如 果 我 们 考虑 掷 恕 子 掷 出 6 的 相对 频率 ， 随 着 掷 的 次 数 不 断 增 加 它 必然 
会 接近 1/6=0.17。 图 6-2 左 图 中 画 出 了 连续 扔 一 百 次 硬币 其 中 正面 朝 上 的 相对 
频率 ， 而 右 图 则 画 出 了 连续 搓 100 次 货 子 数字 6 朝 上 的 相对 频率 。 从 两 幅 图 中 可 
以 看 出 在 刚 开 始 的 时 候 相 对 频率 有 较 大 的 起 伏 ， 但 是 很 快 就 分 别 稳 定 在 0.5 和 
0. 17 附近 。 碳 图 在 稳定 的 过 程 中 看 起 来 稍微 有 点 不 同 ， 关 键 在 于 搓 仍 子 很 难 掷 




















@， 相对 频率 可 以 被 看 做 是 平均 值 。 在 扔 硬币 的 例子 中 , 用 1 代 蔡 H， 用 0 代 蔡 T， 所 以 TTHTH 可 以 
被 转化 成 00101。 这 样 相对 频率 就 变 成 了 0 和 1 的 连续 平均 数 了 ， 而 期 望 值 就 变 成 了 0.5 ( 想 一 想 
我 们 在 第 5 章 介绍 的 指标 ) 。 














第 6 章 必然 概率 : 两 个 迷人 的 数学 结论 


到 6 (我 们 平均 必须 等 待 6 次 才能 掷 出 6) 。 这 种 不 成 功 的 尝试 表现 在 图 中 的 更 长 
的 “下 坡 斜 面 ” 上 。 在 试验 中 很 有 可 能 连续 10 次 或 是 15 次 都 没有 掷 出 6， 这 种 
情况 在 第 20 ~ 30 次 和 第 40 ~ 55 次 之 间 都 发 生 了 。 而 类 似 的 多 次 扔 硬币 没有 扔 出 
正面 的 情况 发 生 的 概率 就 小 很 多 。 
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图 6-2 ” 扔 硬币 和 掷 般 子 的 相对 频率 
(各 自 对 应 的 成 功 概率 0.5 和 0.17 用 虚线 表示 ) 











18 世纪 法 国 博物 学 家 、 科 学 家 蒲 丰 伯 荔 提出 了 一 个 也 许 并 不 实际 但 却 充 满 
想象 力 的 关于 大 数 定律 的 应 用 .2 假设 地 板 是 由 平行 的 木 条 铺 成 的 ， 每 个 木 条 都 是 
一 英寸 宽 ， 把 一 根 一 英寸 长 的 针 扔 在 地 板 上 。 通 过 计算 可 以 知道 这 根 针 与 两 块 木 条 
之 间 的 线 相交 的 概率 为 2/m。 我 在 第 1 章 时 就 介绍 过 5 作为 圆周 率 为 人 熟知 ， 但 在 
没有 圆 的 情况 下 它 也 会 时 不 时 地 出 现 。 在 这 个 例子 中 , 站 却 并 不 是 突然 出 现 的 ， 因 
为 至 少 在 针 与 木 条 之 间 是 会 形成 夹 角 的。 如 果 你 懂 一 些 三 角 学 的 知识 ， 你 就 知道 在 
这 种 情况 下 ~ 的 出 现 非常 自然 (如 果 你 用 的 单位 是 弧度 而 非 角度 ) 。 

不 论 如 何 ， 投 针 法 可 以 被 用 来 计算 mw 的 近似 值 。 如 果 你 反复 地 投 n 次 针 ， 计 
算 它 与 线 相交 的 次 数 并 记 作 L。 运 用 大 数 定律 你 可 以 知道 相交 的 相关 频率 =L/n ~ 
2/m， 从 而 可 以 得 到 7 二 2 x nAL。 这 种 方法 也 被 称 为 “ 薄 丰 投 针 ”。 不管 你 信 不 
信 ， 但 确实 有 人 真 的 做 了 投 针 试验 。 意 大 利 数学 家 拉 泽 里 尼 (Lazzarini) 在 1901 
年 时 宣称 经 过 3408 次 试验 之 后 ， 它 得 到 的 数字 与 5 小数 点 后 六 位 数 一 样 。 这 太 
让 人 惊讶 了 。 连 续 投 3408 次 针 ， 然 后 得 到 小 数 点 后 的 六 位 数 一 样 的 概率 只 有 十 

















”他 的 全 名 是 乔治 斯 . 路 易 斯 . 勒 克 莱 尔 ， 布 丰 伯 萎 ( Georges-Louis Leclerc, Count of Buffon ) 
(1701 一 1788)。 他 在 生物 学 和 自然 历史 上 做 出 了 杰出 的 贡献 ， 并 深 深 地 影响 了 达尔 文 和 现代 生态 
学 。 但 对 于 概率 学 家 们 来 说 最 熟悉 的 还 是 薄 丰 投 针 问题 。 























生活 中 的 概率 趣事 


万 分 之 一 。 要 使 小 数 点 后 第 二 位 数字 跟 7 一样 就 已 经 非常 不 容易 了 ， 大 概 只 

10% 的 机 会 。 学 界 广泛 认 为 拉 泽 里 尼 在 撒谎 。 他 的 针 的 长 度 其 实 只 有 木板 宽度 的 
5/6， 这 样 就 使 得 相交 的 概率 被 5/6 影响 了 ,计算 出 来 的 5 就 变 成 了 5/3 x n/L。 
分 数 355/133 的 值 与 7 在 小 数 点 后 六 位 数 相同 。 因 为 5/3 x213/113 =355/133， 所 
以 如 果 要 得 到 这 个 数字 拉 泽 里 尼 就 必须 保证 213 次 投 针 中 有 113 次 相交 。 而 此 时 
的 概率 大 概 是 5. 5% ， 如 果 他 失败 了 他 又 要 重新 开始 ， 或 者 希望 投 2 x213 = 426 
次 时 相交 2 x 113 = 226 次 ,或 者 是 投 639 次 成 功 339 次 …… 乘 法 法 则 依然 适用 。 
你 看 ， 拉 泽 里 尼 宣 称 他 进行 了 16 x 213 = 3408 次 试验 ， 其 中 成 功 了 16 x 113 = 
1808 次 。 很 显然 他 以 一 种 聪明 的 方式 弄虚作假 了 ， 无 伤 大 雅 。 薄 丰 投 针 法 也 许 
是 计算 5 的 值 最 麻烦 的 一 种 方法 。 但 是 他 却 匠 心 独 运 地 将 站 和 看 似 毫 不 相关 的 
随机 试验 联系 起 来 了 。 








6.2 半斤八两 ? 大 数 定 律 的 误解 


没有 人 可 以 不 受 大 数 定律 的 影响 。 这 个 定律 一 旦 被 打破 ， 世 界 将 会 陷 人 不 可 
想象 的 混乱 之 中 。 你 想 一 想 当 你 早上 坐 在 厨房 餐桌 边 喝 咖 啡 看 报纸 时 ， 读 到 了 这 
样 一 个 头条 “大 数 定律 违宪 ”。 罕 然 你 倒 进 咖啡 里 的 奶油 决定 自己 应 当 凝 结 成 一 
块 沉 在 杯 底 而 不 是 被 均匀 地 搅 匀 。 空 气 变 得 稀薄 ; 所 有 的 氧气 分 子 都 跑 离 了 客 
厅 。 你 的 老板 打 电 话 解雇 你 ， 因 为 突然 发 生 了 数 以 千 计 的 车 祸 ， 你 工作 的 保险 公 
司 已 经 破产 了 。 简 阿姨 打 电 话 告诉 你 她 买 的 强力 球 彩 票 中 奖 了 ， 但 是 还 有 65 万 
人 也 买 了 同样 的 号 。 如 果 平 均 行 为 不 再 有 效 ， 我 们 将 会 陷入 人 无尽 的 麻烦 之 中 .9 
罗伯特 . 寇 特效 (Robert Coates) 在 1947 年 时 写 了 一 篇 名 为 《定律 》 的 小 故事 
发 表 在 《纽约 客 》 上 。 在 这 个 故事 中 ， 议 会 立法 要 求 每 个 人 都 变 成 一 样 的 人 ， 
一 切 开始 失控 。 这 让 我 想起 了 瑞典 幽默 作家 泰 治 ， 丹尼尔 森 (Tage Danielsson ) 




















© ”但 有 时 对 平均 数 定律 短暂 的 疏忽 却 是 有 利 的 。1950 年 3 月 的 一 个 晚上 ， 内 布 拉 斯 加 州 比 阿 特 丽 斯 
的 一 个 教堂 唱诗 班 准备 在 7 点 20 分 排练 ， 但 唱诗 班 的 全 部 十 五 位 成 员 均 因为 不 相关 的 原因 迟到 了 
五 分 钟 以 上 。 而 当晚 7 点 25 分 时 ， 这 个 空 无 一 人 的 教堂 被 爆炸 摧毁 了 。 从 这 一 事件 发 生 的 概率 来 
看 究竟 是 上 帝 的 干预 还 是 恶魔 作 崇 ， 我 不 予 置 评 。 正 如 我 们 之 前 在 书 中 常 说 的 一 样 ， 稀 有 事件 发 

生 的 时 候 常 常会 让 人 大 吃 一 惊 。 稀 有 事件 法 则 完全 可 以 与 平均 数 法 则 和 平 相处 。 
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在 1946 年 写 的 男 外 一 个 小 故事 。 在 这 个 故事 中 弗 兰 肯 斯 坦 博士 造 出 了 一 个 典型 
的 平均 瑞典 市 民 斯 文 . 埃 里 克 … 平均 先生 ， 他 身体 的 各 项 数据 是 所 有 人 的 平均 
值 。 平 均 先 生 有 1. 25 个 孩子 ， 每 周 看 0.75 部 电影 ， 每 三 个 月 得 半 次 感冒 ， 他 说 
的 话 都 是 由 瑞典 语 中 每 个 单词 适用 的 频率 决定 的 。 平 均 先 生 决 定 要 反抗 这 些 操纵 
他 生命 的 小 数 ， 各 种 混乱 也 爆发 了 。 想 一 想 如 果 平 均 的 人 决定 晚上 不 看 电视 了 ， 
这 个 国家 会 发 生 些 什么 事 。9 

大 数 定 律 不 同 于 自然 界 的 物理 定律 之 处 在 于 : 它 并 没有 告诉 你 未 来 会 发 生 什 
么 ， 而 只 告诉 你 长 期 平均 会 发 生 什么 。 你 向 空中 抛 一 枚 硬币 ， 万 有 引力 定律 会 告诉 
你 : 硬币 必然 会 落下 来 。 而 大 数 定律 却 无 施展 之 地 。 但 如 果 你 重复 向 空中 多 次 抛 硬 
币 ， 万 有 引力 定律 依然 会 告诉 你 : 每 次 硬币 都 会 落下 来 。 但 是 这 时 大 数 定律 能 告诉 
你 : 这 些 硬币 落下 来 的 时 候 50% 的 机 会 正面 朝 上 。 有 趣 的 是 现代 量子 物理 学 定律 具 
有 概率 特性 ， 因 此 相 较 于 经 典 物理 学 定律 它们 跟 大 数 定 律 更 相似 。 

大 数 定律 也 是 赌场 赚钱 的 秘诀 所 在 。 我 们 之 前 计算 过 轮 盘 游戏 中 庄家 平均 每 
1 美元 能 够 赚 5 美 分 。 当 只 有 一 个 玩家 时 会 发 生 什么 事情 没有 人 可 以 预料 到 。 但 
是 有 无 数 个 玩家 在 赌博 ， 大 数 定律 就 把 这 种 不 确定 的 情况 变 成 了 必然 : 赌 徒 们 也 
许 会 赢 几 次 ,但 是 庄家 才 是 最 后 的 赢家 。 加 拿 大 概率 学 家 杰 弗 里 ， 罗 和 森 塔 尔 在 
2005 年 发 表 了 一 本 非常 有 趣 的 书 《 命 中 雷霆 》 (Struck By Lightning) ， 书 中 介绍 
了 他 观察 到 的 一 些 有 意思 的 现象 。 关 于 政府 是 否 应 当 支 持 博彩 业 的 争论 依然 继 
续 ， 但 从 来 没有 人 提出 过 赌场 可 能 会 输 钱 这 一 论据 。 妇 掺 缘 知 赌场 日 进 斗 金 ， 这 
与 小 卖 部 或 礼品 店 的 盈利 完全 不 同 ， 这 是 大 数 定 律 在 起 作用 。 威 廉 . 梅 西 (Wil- 
liam H. Macy) 在 电影 《倒霉 鬼 》 (The Cooler) 中 饰演 了 反面 角色 ， 赌 场 和 雇佣 他 
站 在 赌 桌 旁 ， 目 的 是 威吓 那些 激动 的 赌 徒 。 激 动 还 是 冷 酶 ， 威 廉 还 是 皮特 ， 总 之 
是 大 数 定律 称 王 。 

男 外 一 个 依靠 大 数 定律 生存 的 行业 是 保险 业 。 如 果 我 要 创办 一 家 保险 公司 ， 
我 会 把 不 同事 故 类 型 的 概率 和 相关 的 成 本 都 计算 出 来 ， 然 后 定 下 能 使 预期 收入 最 
大 化 的 方案 。 假 设 我 让 你 交 1000 美金 的 车 险 ， 这 时 我 就 有 一 个 预期 收入 了 。 但 






















































































”比利时 博学 家 阿道夫 . 凯特 勒 (1796 一 1874) 在 《平均 人 》(《The Average Man》) 中 表达 过 相同 
的 观点 。 凯 特 勒 最 重大 的 发 现 就 是 身体 质量 指数 (BMI) 。 这 一 指数 时 至 今日 依然 被 广泛 运用 于 计 
算 特定 体重 对 应 的 理想 体重 。 
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如 果 你 作为 我 唯一 的 客户 发 生 了 车 祸 ， 我 就 必须 赔偿 。 我 需要 许多 客户 来 使 大 数 
定律 发 生 作用 ， 从 而 保证 我 稳定 的 利润 。 从 这 种 意义 上 说 保险 公司 和 赌场 是 一 样 
的 ， 你 在 这 里 下 注 然后 输 了 钱 。 实 际 上 当 你 买 人 寿险 时 ,保险 公司 会 预计 你 什么 
时 候 去 世 ， 而 你 在 下 注 押 自 己 会 在 该 时 刻 之 前 死去 。 

许多 人 也 许 不 懂 我 们 刚才 讲 的 数学 意义 上 的 大 数 定律 ， 但 是 对 大 数 定律 的 其 他 
运用 会 很 熟悉 。 瑞 士 数学 家 詹姆斯 . 伯 努 利 〈James Bemoulli) (1654 一 1705) 在 他 
给 数学 家 、 哲 学 家 苹 特 弗 里 德 . 莱 布 尼 茨 (Gottfried Wilhelm Leibniz) 写 的 一 封 信 
中 最 先 正式 提出 和 证 明 大 数 定律 。 他 指出 “即使 是 最 思 恰 的 人 和 赁 着 天 生 直 觉 也 知 
道 ”这 个 定律 是 有 效 的 .2 让 我 们 再 一 次 回归 到 扔 硬币 的 例子 。 大 家 都 知道 长 期 反 
复 扔 硬币 出 现 正面 和 反面 的 次 数 趋 近 相 等 。 最 终 所 有 的 事情 都 会 平衡 。 但 是 我 们 
必须 清楚 地 知道 在 哪 一 种 意义 上 这 句 话 是 对 的 ， 在 什么 情况 下 这 人 句 话 又 不 对 。 人 
们 常常 会 误解 大 数 定 律 。 这 个 定律 究竟 说 的 是 什么 呢 ? 我 们 来 看 一 看 吧 。 

有 人 会 说 扔 的 次 数 越 多 ， 硬币 正 反 面 出 现 的 次 数 就 越 趋 近 相等 。 这 句 话 不 仅 
是 错 了 ， 而 且 是 大 错 特 错 ! 事实 上 ， 在 1.9 节 中 我 们 已 经 知道 扔 了 2 xn 次 之 后 ， 
扔 出 正 反 面 次 数 相等 的 概率 越 来 越 小 ， 这 个 概率 等 于 1/ Vn xT。 这 违背 大 数 定 
律 吗 ? 不 。 因 为 你 将 绝对 频率 与 相对 频率 混淆 起 来 了 。 绝 对 频率 指 的 是 正面 朝 上 
的 次 数 ， 而 相对 频率 则 是 用 正面 朝 上 的 次 数 除 以 总 次 数 。 大 数 定律 只 是 说 相对 频 
率 会 无 限 趋 近 于 0.5 ， 而 不 是 说 绝对 频率 会 接近 一 半 的 次 数 。 

以 扔 100 次 为 例 ， 扔 到 50 次 正面 朝 上 、50 次 反面 朝 上 的 概率 只 有 8% 。 但 
在 这 种 情况 下 相对 频率 依然 非常 接近 0.5。 正 面 朝 上 的 次 数 在 45 ~55 次 之 间 的 概 
率 大 约 为 70% ， 相 对 频率 在 0.45 ~ 0.55 之 间 。 如 果 以 扔 1000 次 为 例 ， 那 么 正好 
500 次 正面 朝 上 的 概率 只 有 2.5% ， 而 正面 朝 上 次 数 在 495 ~ 505 次 之 间 的 概率 只 
有 25% 。 而 相对 频率 在 0.45 ~0. 55 之 间 的 概率 则 惊人 地 达到 了 99. 8% 。 随 着 次 
数 的 增加 ， 想 让 期 望 值 固 定 在 一 定 范围 内 会 越 来 越 难 ; 但 是 同样 情况 下 相对 频率 





























”詹姆斯 伯 努 利 在 1713 年 写 下 了 世界 上 第 一 本 概率 专著 《猜想 的 艺术 》 (the “Art of Conjec- 
ture”) 。 为 了 纪念 他 ， 任 何 存在 两 种 可 能 性 的 试验 (如 扔 硬币 ) 被 称 为 伯 努 利 试验 。 雅 各 布 一 家 
有 许多 杰出 的 数学 家 ， 比 如 他 的 兄弟 约翰 ,侄子 丹尼尔 和 尼古拉斯 。 数 学 家 贝尔 在 《数学 精英 》 
一 书 中 写 道 : “ 伯 努 利家 族 中 至 少 有 120 位 后 代 在 各 个 领域 做 出 了 杰出 的 贡献 ， 没 有 一 人 籍 籍 
无 名 !” 
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则 会 越 来 越 简单 。 图 6-3 显示 出 在 相对 频率 不 断 靠 近 0. 5 时 ， 绝 对 频率 是 如 何 大 
幅 变动 的 。 
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图 6-3 扔 1000 次 硬币 的 相对 频率 和 绝对 频率 
图 6-3 左 图 表示 扔 1000 次 硬币 ， 正 面 朝 上 的 相对 频率 的 
连续 变化 ， 右 图 表示 正面 朝 上 的 实际 次 数 与 预期 次 数 的 对 比 。 
右 图 中 数字 大 于 0 表示 正面 朝 上 次 数 多 于 反面 朝 上 次 数 ; 小 于 
0 则 表示 反面 朝 上 次 数 多 于 正面 朝 上 次 数 。 注 意 左 图 逐渐 趋 于 
稳定 而 右 图 则 变动 不 断 。 右 图 在 第 100 次 左右 的 大 幅度 变动 对 
左 图 有 明显 的 影响 。 但 是 第 800 次 左右 更 大 幅度 的 变动 却 对 左 
图 数据 影响 很 小 。 
另外 一 个 常见 的 错误 是 “ 赌 徒 廖 误 ”， 它 指 的 是 一 种 错误 的 观念 ， 即 如 果 一 
个 方向 出 现 偏 差 ， 则 为 了 弥补 ,很 可 能 会 出 现 男 一 个 方向 的 偏差 。 当 出 现 连续 的 
正面 朝 上 时 认为 接 下 来 有 很 大 的 可 能 出 现 连续 的 反面 朝 上 。 所 有 人 都 知道 硬币 不 
记得 它 自己 之 前 是 正面 还 是 反面 彰 上 的 ， 这 就 让 所 谓 的 补偿 成 为 无 稽 之 谈 。 但 缺 
乏 关 于 大 数 定律 知识 会 让 很 多 人 相信 存在 无 法 解释 的 补偿 ， 不 然 的 话 为 什么 正面 
朝 上 的 比例 稳定 在 0.5 呢 ?“ 是 的 ， 我 当然 知道 硬币 没有 记忆 ， 但 是 ……… ” 
但 是 大 数 定 律 不 需要 “但 是 …… ”。 图 6-4 右 图 中 画 出 了 连续 扔 500 次 硬币 
的 相对 频率 。 一 开始 ， 反 面 朝 上 的 次 数 非常 多 。 通 过 左 图 可 以 看 出 ， 扔 100 次 之 
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图 6-4 连续 扔 硬币 得 到 的 相对 频率 
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后 只 有 35 次 是 正面 朝 上 ， 偏离 预期 的 50 次 还 是 有 些 远 ， 此 时 的 相对 频率 只 是 
0.35。 通 过 右 图 可 以 发 现 ， 在 这 之 后 相对 频率 逐渐 向 0.5 靠近 ， 扔 500 次 之 后 我 
们 就 非常 接近 于 0.47 了 。 这 难道 意味 着 前 100 次 正面 朝 上 的 次 数 由 后 面 的 400 
次 弥补 了 吗 ? 

错 ! 事实 上 最 后 400 次 中 有 200 次 正面 朝 上 ， 正 是 期 望 次 数 。 即 使 得 到 正面 
朝 上 的 次 数 比 期 望 值 要 小 ， 比 如 180 次 ， 相 对 频率 也 还 是 会 提高 ，215/500 = 
0. 43 。 要 使 得 相对 频率 提高 其 实 只 需要 能 提高 前 100 次 的 35% 的 比例 就 可 以 了 。 
随 着 扔 的 次 数 不 断 增加 ， 前 100 次 的 结果 对 相对 频率 的 影响 越 来 越 小 。 因 此 就 无 
须 刻 意 去 对 这 100 次 的 进行 补偿 ， 只 要 长 期 继续 这 种 平均 行为 就 可 以 抹 去 原来 不 
正常 结果 带 来 的 影响 。 相 对 频率 的 稳定 并 不 排除 随机 性 ， 恰 恰 相 反 ， 其 稳定 性 的 
原因 在 于 随机 性 。9 

商 报 记者 詹姆斯 . 斯 图 尔 特 曾经 在 《 财 智 月 刊 》 的 “常识 ”专栏 中 写 道 : 
“如 果 硬 币 在 前 100 次 中 有 90 次 反面 朝 上 ， 那 么 在 接 下 来 的 100 次 中 就 会 出 现 大 
量 正面 朝 上 的 情况 来 复原 ”。 这 番 话 引起 来 线 上 的 广泛 讨论 ， 他 究竟 是 否 也 陷入 
了 赌 徒 雇 误 呢 ? 我 猿 他 说 “复原 ”是 指 在 接 下 来 的 100 次 中 正面 朝 上 的 情况 会 超 
过 10 次 ， 而 并 不 是 指 会 超过 50 次 。 如 果 是 这 样 的 话 ， 他 就 对 了 。 我 们 预计 接 下 
来 正面 朝 上 的 次 数 会 增加 ， 但 并 不 要 求 它 增 加 得 比 平均 数 还 多 。 斯 图 尔 特 先生 用 
这 个 例子 来 说 明 “ 趋 均 数 回归 ”现象 。 我 们 已 经 有 段 时 间 没 提 弗 朗 西 斯 ， 高 尔 
顿 事 士 了 。 当 他 在 对 父子 的 身高 进行 研究 时 发 现 了 并 创造 了 “回归 ”一 词 。 他 
发 现 通常 高 个 子 男 人 的 儿子 的 身高 比 平均 身高 要 高 ， 但 这 些 儿 子 往往 不 如 自己 的 
父亲 高 。 因 为 遗传 ， 这 些 儿 子 们 通常 比 常人 身高 要 高 ， 但 如 果 这 高 个 子 男人 的 身 
高 比 他 们 家 族 的 平均 身高 还 高 ， 那 么 他 的 儿子 预计 会 比 自己 要 矮 。 用 高 尔 顿 的 话 
来 说 : 高 个 子 男人 的 儿子 “仅仅 只 是 高 而 已 ”"。 高 个 的 特征 在 后 代 中 会 越 来 越 不 
明显 ， 身 高 在 回归 正常 。 高 尔 顿 用 他 那 20 世纪 风格 的 话语 体系 创造 了 “回归 到 
中 等 ”这 一 术语 。 显 然 是 用 来 哀叹 他 的 发 现 : 一 代 不 如 一 代 。 换 个 积极 的 角度 来 
看 他 也 许 就 会 发 现 ， 那 些 普通 人 的 后 代 会 越 来 越 优 秀 。 但 是 他 主要 的 兴趣 在 于 上 




























































































”我 的 好 朋友 ， 杰 出 的 概率 学 家 杰 夫 … 史 泰 福 曾 在 轮 盘 的 赌 桌 上 告诉 我 ， 有 时 一 知 半 解 比 无 知 更 可 
怕 。 当 连续 出 现 7 次 红色 时 ， 无知 的 赌 徒 们 眼 都 不 既 一 下 〈 杰 夫 也 是 ) ， 但 是 由 于 他 们 听 说 过 却 
介 平 均 数 法 则 ， 所 以 他 们 坚信 下 一 次 肯定 会 出 现 黑色 ， 然 后 思春 地 继续 在 黑色 上 加 注 。 
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层 社会 ， 否 则 的 话 现 在 的 术语 就 是 “ 趋 均 数 进步 。 

再 举 个 例子 简单 地 解释 一 下 “ 趋 均 数 回归 ”。 假 设 现在 你 掷 出 了 6， 那 么 下 
一 次 你 预计 掷 出 的 比 6 小 吗 ? 是 的 。 那 会 比 平均 数 3. 5 还 小 四 ?不 。 斯 图 尔 特 先 
生 用 “ 趋 均 数 回归 ”说 明 在 飓风 卡特 里 娜 和 丽 塔 之 后 ， 高 油价 注定 会 下 降 。 不 
论 他 是 对 是 错 ， 在 他 的 类 比 中 存在 一 个 问题 : 混淆 了 极端 情况 和 期 望 值 的 变化 。 
(他 在 文章 中 也 承认 了 这 一 点 。) 油价 的 期 望 值 不 像 投 仍 子 的 期 望 值 一 样 可 以 确 
定 固定 在 3.5， 油 价 和 急剧 上 涨 之 后 可 以 形成 新 的 平均 值 。( 对 于 人 的 身高 来 说 也 
是 适用 的 ， 但 可 能 变化 的 时 间 更 长 。 第 8 章 中 我 们 将 会 仔细 学 习 趋 均 数 回归 ， 
看 看 高 尔 顿 发 现 了 什么 。 

现在 回 到 可 怕 的 叮 风 卡特 里 娜 和 丽 塔 吧 。 在 2005 年 采风 季 节 结 束 之 后 ， 我 
在 广播 中 听 到 有 专家 预测 2006 年 的 由 风 会 比 2005 年 少 。 即 使 我 毫 无 气象 学 知识 
我 也 可 以 做 出 同样 的 预测 。 平 均 每 年 会 有 6 次 飓风 ， 但 2005 年 有 15 次 。 第 二 年 
的 数字 几乎 可 以 肯定 会 趋 近 平 均 ， 比 15 次 要 少 。 即 使 我 们 现在 处 于 飓风 活动 频 
繁 的 周期 中 ， 确 风 次 数 的 平均 值 可 能 会 提高 ， 但 是 15 次 依然 是 一 个 极端 的 情况 。 
如 果 你 听 到 专家 们 预测 明年 飓风 的 次 数 ， 你 就 会 注意 到 他 们 预测 的 数字 就 在 现在 
的 平均 值 与 去 年 飓风 的 次 数 之 间 。 美 国 国家 海洋 和 大 气 局 和 科罗拉多 州立 大 学 气 
象 学 家 菲利普. 克 洛 茨 巴赫 (Philip Klotzbach) 和 威廉 . 格雷 (William Gray) 领 
导 的 确 风 小 组 都 预测 2006 年 的 飓风 季 会 发 生 9 次 由 风 。 这 个 预测 是 基于 大 量 的 
气象 数据 和 指标 做 出 的 ， 但 是 最 终 高 尔 顿 也 会 得 到 相同 的 结论 。 当 你 读 到 本 书 的 
时 候 ， 你 已 经 知道 2006 年 的 真实 情况 了 。 

















6.3 扔 硬币 与 高 速 拥 墙 


连续 扔 硬币 试验 非常 简单 ， 但 是 在 它 背 后 却 隐藏 着 许多 惊喜 和 意外 。 为 了 说 
明 这 些 惊 喜 和 意外 ， 我 们 来 举 一 个 例子 。 假 设 汤姆 和 哈 利 在 扔 硬币 ， 如 果 正 面 朝 
上 的 话 ， 哈 利得 一 分 ; 反面 朝 上 则 汤姆 得 一 分 。 随 着 游戏 的 继续 ， 他 们 各 自 的 分 
数 不 断 增加 ， 看 起 来 这 是 一 个 相当 公平 完美 的 游戏 。 有 时 哈 利 会 领先 ， 有 时 汤姆 
又 会 反超 , 偶尔 他 们 分 数 一 样 。 比 如 ， 如 果 游 戏 进行 了 十 轮 结果 是 HTHT- 
THHTHH， 则 刚 开 始 的 时 候 哈 利 领先 ， 五 次 之 后 汤姆 反超 ， 七 次 之 后 哈 利 重 新 领 
先 ， 第 十 次 结束 时 哈 利 领先 两 分 。 图 6-5 画 出 了 这 一 过 程 。 当 线 在 0 之 上 时 ( 虚 
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线 表 示 0) ， 硬 币 正 面 朝 上 比 反面 朝 上 的 次 数 更 多 ， 此 时 哈 利 领先 。 反 之 当 线 在 0 
之 下 时 ， 汤 姆 领先 。 对 应 y 轴 上 是 正 数 则 汤姆 领先 ， 负 数 则 哈 利 领先 。 恰 好 是 0 
时 ， 则 为 平局 。 在 这 个 例子 中 ， 有 4 次 平局 ， 两 次 交换 领先 位 置 。 
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图 6-5 汤姆 和 哈 利 扔 硬币 游戏 的 前 十 次 结果 


现在 汤姆 和 哈 利 要 扔 100 轮 硬币 ， 在 记录 的 过 程 中 我 们 发 现 领先 者 一 直 在 来 
回 改 变 。 因 为 这 是 一 个 公平 的 游戏 ， 所 以 虽然 领先 者 一 直 在 变化 ， 但 似乎 每 个 人 
都 可 以 在 一 半 的 时 间 内 占据 领先 地 位 。 领 先 者 交替 变化 了 大 概 有 20 次 或 更 多 ? 

接 下 来 我 要 立刻 戳 破 你 们 这 些 幻想 的 气泡 。 最 有 可 能 发 生 的 情况 是 某 一 个 人 
一 直 领 先 ! 大 概 有 15% 的 机 会 ， 交 蔡 领 先 的 预期 值 只 有 3.5。 如 果真 的 交替 了 领 
先 的 位 置 ， 最 可 能 交替 的 次 数 是 1， 然 后 次 可 能 的 是 2， 接 着 是 3 如 此 以 往 。 领 
先 位 置 交替 10 次 以 上 的 概率 仅 有 4% 。 总 体 来 说 这 是 对 的 ， 不 论 他 们 玩 多少 局 游 
戏 , 最 可 能 的 就 是 一 个 人 在 大 部 分 时 间 里 保持 领先 地 位 。 而 最 不 可 能 的 情况 就 是 
每 个 人 在 一 半 的 情况 下 领先 ! 当然 汤姆 和 哈 利 都 有 可 能 一 直 保持 领先 地 位 ， 所 以 
他 们 领先 是 等 可 能 的 ， 但 并 不 是 在 游戏 过 程 中 等 可 能 地 交替 领先 。 即 使 是 在 我 们 
之 前 观察 的 十 轮 游 戏 之 中 你 也 可 以 发 现 这 个 事实 。 你 可 以 坐 下 来 用 纸 和 笔 写 出 所 
有 的 2 ”=1024 种 可 能 ， 随 机 挑选 几 种 可 能 你 也 会 发 现 同样 的 情况 。 在 很 多 情况 
下 这 条 线 完全 在 0 的 上 方 或 下 方 ， 很 少 有 与 0 线 相 交 的 。 

那 如 果 他 们 进行 1000 轮 游 戏 ， 领 先 地 位 交替 次 数 会 变 成 十 倍 吗 ? 不 会 。 期 
望 值 是 12。 当 进行 10000 轮 游 戏 时 ， 期 望 值 变 成 了 39。 期 望 值 增加 的 比例 与 游 
戏 比 例 并 不 同步 。 如 果 游 戏 的 次 数 变 成 了 十 倍 ， 期 望 值 大 概 只 会 变 成 三 倍 。 随 着 
游戏 的 不 断 推 进 ， 领 先 位 置 似乎 越 来 越 不 可 能 改变 。 在 这 样 一 个 公平 的 游戏 中 ， 
这 种 现象 让 人 觉得 吃惊 。 不 ， 你 不 应 该 感到 惊讶 。 还 记得 我 们 之 前 提 过 的 在 2 x 
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n 次 之 后 ， 平 均 越 来 越 不 可 能 了 ， 概 率 只 有 1/ Vw xn。 因 此 在 100 轮 游戏 之 后 ， 
平局 的 概率 只 有 8% (n =50); 1000 轮 游 戏 之 后 (n = 500)， 平 局 的 概率 只 
2.5% ; 而 10000 轮 游戏 之 后 (n=5000) ,平局 的 概率 为 0.8% 。 这 也 说 明了 领先 
位 置 的 交替 会 越 来 越 难 ， 因 为 具有 先 平局 之 后 才能 完成 反超 。 实 际 上 ， 平 局 之 后 
下 一 轮 游戏 之 前 落后 的 选手 就 有 一 半 的 机 会 可 以 反超 了 。 

我 们 并 不 期 竺 在 长 期 的 游戏 中 会 有 很 多 平局 ， 换 而 言 之 我 们 预计 结果 会 偏离 
0 线 。 当 出 现 了 一 次 平局 ， 两 轮 之 后 又 是 平局 的 概率 为 50% 。 结 果 的 轨迹 可 能 会 
在 0 线 附近 ， 经 过 几 次 平局 之 后 ， 交 替 一 下 领先 地 位 ， 但 最 终 还 是 会 偏离 0 线 。 
这 种 聚集 现象 我 们 在 第 3 章 中 已 经 介绍 过 了 。 平局 会 集中 在 一 段 时 间 出 现 ， 所 以 
它们 并 不 是 罕见 而 只 是 很 不 规律 。 一 旦 轨迹 偏离 了 0 线 ， 每 一 轮 游戏 之 后 它 就 会 
随机 变化 一 次 ,没有 任何 无 形 之 力 将 其 拉 回 0 线 。 所 以 一 旦 它 偏离 远 了 就 要 过 很 
长 的 时 间 才 会 回 到 0 线 附 近 。 

图 6-6 是 计算 机 模拟 的 1000 轮 游戏 的 轨迹 图 。 其 中 有 三 幅 图 都 是 真 的 ， 一 














幅 图 是 假 的 。 几 乎 不 可 能 模拟 出 左上 的 图 表示 的 情形 。 如 果 一 定 要 得 到 这 种 情况 
我 只 能 每 次 模拟 几 轮 游戏 ， 一 旦 它 要 偏离 0 线 我 就 重新 开始 游戏 。 这 也 是 为 什么 
40 40 
20 20 上 








350 -20 Vn Wy 

-40 -40 
200 400 600 800 1000 200 400 600 800 1000 

40 40 














图 6-6 扔 1000 次 硬币 可 能 出 现 的 结果 
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它 是 四 幅 图 中 最 不 可 能 出 现 的 情况 ， 因 为 此 时 我 并 不 是 随机 来 玩 游戏 的 。 剩 下 的 
三 幅 图 是 计算 机 模拟 的 结果 ， 它 们 都 没有 出 现 极端 的 情况 。 实 际 上 还 有 几 个 计算 
机 模拟 出 来 相对 极端 的 结果 被 我 排除 了 。 我 们 可 以 注意 到 在 这 三 幅 真实 的 图 中 轨 
迹 偏离 了 0 线 ， 领 先 位置 变 化 很 少 ， 而 且 平 局 集中 在 一 块 发 生 。 

如 果 大 部 分 人 都 把 图 6-6 中 左上 图 当成 是 正确 的 图 ， 我 一 点 也 不 觉得 吃惊 。 
相反 ， 如 果 他 们 知道 这 幅 图 是 假 的 ， 我 才 会 大 吃 一 惊 。 不 论 是 从 量子 物理 学 或 者 
遗传 学 的 角度 还 是 从 每 天 都 会 经 历 的 平凡 的 风险 和 机 会 角度 看 ， 人 们 日 常 的 生活 
因为 随机 性 而 变 得 丰富 多 彩 。 但 我 们 还 是 无 法 随时 刺 破 随机 性 的 面纱 。 

那么 是 不 是 当 轨 迹 偏离 了 0 线 之 后 就 再 也 不 会 回归 了 呢 ? 不 ,递归 使 用 全 概 
率 法 则 ， 很 容易 就 可 以 证 明 。 这 与 我 们 在 第 1 章 中 解决 球拍 类 运动 问题 的 解法 一 
致 ， 与 2.6 节 中 解决 细胞 分 支 灭 绝 问题 也 类 似 。 放 我 们 从 0 出 发 ， 用 步行 的 方式 
沿 着 这 条 轨迹 走 。 第 一 步 可 能 是 1 或 -1。 假 设 我 们 向 上 走 ， 到 达 了 1。 问 题 来 
了 : 我 们 最 终 又 回 到 0 的 概率 是 多 少 ? 假设 这 个 问题 的 概率 为 p。 第 二 步 的 时 候 
我 们 有 0. 5 的 概率 回 到 0， 也 有 0. 5 的 概率 走 到 了 2。 现 在 到 了 问题 的 关键 之 处 
了 。 我 们 要 从 2 回 到 0 需要 先 回 到 1， 因为 从 2 回 到 1 的 概率 与 从 1 回 到 0 的 概 
率 一 样 ， 所 以 此 时 概率 也 为 p。 当 我 们 回 到 了 1， 我 们 又 要 从 1 回 到 0， 这 时 概率 
仍 为 p。 所 以 从 2 回 到 0 的 概率 为 p xp =p”( 运 用 到 了 独立 性 )。p 符合 等 式 p = 
0.5x1l1+0.5 xp*， 其 中 “1” 表 示 我 们 走 到 1 时 立刻 回 到 0 的 情况 。 当 代入 p=1 
时 ， 等 式 正好 成 立 ， 所 以 最 终 回归 到 0 是 必然 (如果 你 知道 怎么 解 二 次 方程 ， 你 
就 会 知道 方程 的 解 不 止 一 个 ,但 在 这 里 不 一 样 ，1 是 二 重 根 )。 这 是 第 一 步 从 
0 走向 1 的 情况 ， 显 然 如 果 第 一 步 从 0 走 到 -1 计算 的 过 程 也 是 一 样 。 我 们 证 明了 
最 终 轨迹 是 会 回 到 0 的 ， 当 轨迹 回 到 0 之 后 它 又 会 重新 开始 向 上 或 向 下 延伸 。 

现实 生活 中 有 很 多 例子 都 与 扔 硬币 游戏 相似 。 约 输 : 黑 格 (John Haigh ) 
在 《 抓 住 机 会 》(Taking Chances) 一 书 中 举 了 一 个 例子 : 在 交通 拥堵 时 两 辆 车 
并 排 在 等 待 。 你 的 车 和 隔壁 的 车 每 次 都 等 可 能 可 以 移动 一 辆 车 的 距离 。 旅 行者 
的 守护 神 一 一 圣 : 克里斯托弗 通过 扔 人 硬币 来 决定 每 一 次 谁 移动 。 如 果 你 输 了 ， 
你 很 快 就 会 被 追赶 上 或 者 落后 于 你 的 对 手 。 每 次 都 能 移动 一 辆 车 的 距离 ， 你 有 
很 大 的 机 会 可 以 通过 后 视 镜 看 到 你 的 对 手 逐 渐 消 失 。 当 你 把 现在 的 对 手 远 远 甩 
在 后 面 之 后 ， 你 会 时 住 旁 边 的 新 对 手 。 在 堵车 的 时 候 你 没 办 法 觉得 自己 是 人 生 


过 
服 夭 。 
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如 果 两 个 旗 鼓 相当 的 球 队 反复 比赛 ， 我 们 可 以 预期 比赛 的 结果 与 扔 硬币 结 
图 相似 。 显 然 体 育 比赛 会 受到 许多 因素 的 影响 ， 你 无 法 全 部 都 预计 到 。 把 这 些 无 
法 估量 的 因素 放 在 一 边 ， 让 我 们 来 看 看 两 项 由 来 已 久 的 著名 赛事 : 美国 陆 海 军 橄 
虎 球 赛 和 牛津 剑桥 赛 艇 对 抗 赛 。 

美国 陆 海 军 橄榄 球赛 起 源 于 1890 年 (期间 10 年 没有 举行 赛事 ) ，2005 年 
赛事 结束 之 后 海军 队 以 50-49 的 成 绩 稍 微 领先 ， 其 中 有 7 场 是 平局 。 英 国 两 所 
名 校 牛 津 大 学 和 剑桥 大 学 之 间 的 赛 艇 对 抗 赛 从 1829 年 开始 每 年 举行 一 次 ， 两 
次 世界 大 战 期 间 曾经 暂停 过 比赛 。2005 年 比赛 结束 之 后 剑桥 大 学 以 78-72 的 成 
绩 领 先 。 在 1877 年 的 比赛 中 ， 两 支队 伍 不 分 胜 负 。 图 6-7 是 这 两 项 赛事 的 结 
果 轨 迹 图 ， 可 以 发 现 它 们 与 扔 硬币 结果 轨迹 图 是 多 么 相似 (没有 包括 平局 和 取 
消 的 赛事 ， 所 以 年 份 与 成 绩 不 是 完全 符合 ) 。 陆 军 领先 的 时 间 比 海军 更 长 ， 一 
度 连续 48 年 领先 。 在 赛 艇 对 抗 赛 中 ， 两 支队 伍 领 先 的 时 间 差 不 多 ,但 是 我 们 
可 以 发 现 领先 位 置 交换 得 很 少 。 在 我 写 书 的 这 一 年 一 -2005 年 ， 剑 桥 大 学 已 经 
领先 70 年 了 。 
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图 6-7 两 项 赛事 的 结果 轨迹 
图 6-7 左 图 是 从 1890 年 开始 的 美国 陆 海 军 橄榄 球赛 结果 轨迹 图 ， 
右 图 是 从 1829 年 开始 的 牛津 剑桥 赛 艇 对 抗 赛 结果 轨迹 图 。0 线 之 上 表 
示 陆 军 和 牛津 大 学 领先 。 平 局 或 取消 比赛 年 份 的 赛事 没有 包括 进来 。 


还 有 另外 一 项 没有 那么 出 名 却 也 同样 激烈 的 兖 争 : 瑞典 分 兰 年 度 田径 对 抗 
赛 。 瑞 典 人 把 这 个 赛事 称 为 “芬兰 之 战 ”， 芬 兰 人 则 将 其 称 为 “芬兰 一 瑞典 国际 
赛 ” 。 这 项 赛事 包括 了 奥林匹克 所 有 的 田径 项 目 ， 每 个 国家 派出 三 个 代表 参加 每 
个 项 目 ( 在 中 长 跑 比赛 中 常常 会 有 人 以 肘 硕 人 犯规 ，1992 年 的 比赛 中 六 名 运动 员 
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在 1500m 赛跑 中 全 部 都 被 取消 资格 ) 。1925 年 开始 了 男子 赛事 ， 中 途 因为 第 二 次 
世界 大 战 而 停止 了 一 次 比赛 ， 而 女子 的 比赛 则 从 1953 年 开始 。 图 6-8 显示 了 男 
子 与 女子 比赛 结果 。 它 们 同样 地 与 硬币 游戏 模式 相似 。 到 2005 年 为 止 瑞典 男子 
比赛 以 25: 40 的 结果 大 比分 落后 ,但 女子 比赛 却 以 27: 23 的 成 绩 领 先 。 在 我 运动 
热情 最 为 高 涨 的 20 世纪 70 年 代 ， 不 论 男女 赛 ， 瑞 典 没有 赢 一 场 ， 时 运 不 济 。 但 
是 知道 了 随机 路 径 行 为 之 后 ， 我 非常 确信 瑞典 男子 队 最 终 会 领先 的 (我 的 芬兰 朋 
友 们 却 无 法 接受 这 个 不 可 避免 的 事实 ) 。 
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图 6-8 瑞典 芬兰 田径 对 抗 赛 
图 6-8 左 图 表示 从 1925 年 开始 的 男子 比赛 ; 右 图 表示 从 1953 年 开始 
的 女子 比赛 。0 线 之 上 表示 瑞典 领先 。 





本 扔 硬币 图 是 概率 学 家 们 称 为 “随机 游 走 ”的 典型 图 例 。 为 人 们 津津 乐 道 的 
例子 就 是 醉 汉 步履 蹦 踊 ， 每 次 向 左 走 和 向 右 走 的 概率 一 样 。 另 外 一 个 例子 就 是 
暴风 雪 中 迷 路 的 人 此 时 最 好 保持 清醒 ) 走路 的 步伐 。 由 于 扔 硬币 游戏 是 公平 
游戏 ， 每 一 步 向 上 还 是 向 下 的 概率 是 一 样 的 ， 我们 又 把 这 种 行为 称 为 对 称 游 
走 。 对 那些 不 对 称 的 随机 游 走 ， 如 在 轮 盘 上 连续 押 奇 数 ， 则 你 每 一 轮 启 的 概率 
是 18/38=0.47， 比 0.5 稍 小 。 所 以 如 果 你 把 你 的 顾 的 情况 用 图 表示 出 来 ， 随 
机 游 走 其 实 也 是 对 称 的 ， 只 不 过 每 次 下 行 的 概率 比 上 行 稍微 大 一 些 。 在 较 短 的 
周期 内 ， 你 很 难 分 辨 出 它 与 重复 扔 硬币 游戏 的 不 同 之 处 。 但 是 长 期 看 来 ， 轮 
盘 图 必然 会 处 于 0 线 之 下 负数 的 那 一 侧 。 不 同 于 硬币 的 例子 ， 此 时 有 一 个 作 
用 力 持 续 让 轨迹 往 下 行 。 大 数 定 律 告诉 我 们 ， 这 个 作用 力 可 能 会 遇 到 一 些 阻 
碍 ,但 是 长 期 来 说 还 是 会 成 功 的 。 在 你 最 终 走向 注定 输 的 轨迹 之 前 有 19 次 
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机 会 不 赚 不 赔 。 





6.4 大 数 定律 的 由 来 


这 一 方 我 们 主要 介绍 数学 公式 和 大 数 定律 的 证 明 。 即 使 你 很 不 喜欢 理论 和 公 
式 ， 我 还 是 建议 你 不 要 轻易 跳 过 这 一 节 。 这 一 节 相 较 于 之 前 的 章节 可 能 会 有 一 些 
难度 ， 但 是 它 会 向 你 展示 高 等 概率 理论 的 世界 是 多 么 的 有 趣 。 当 然 ， 如 果 你 实在 
不 感 兴趣 你 也 可 以 跳 过 这 一 节 直 接 进入 6.5 节 。 

在 介绍 新 知识 之 前 ， 让 我 们 来 回忆 一 下 第 5 章 中 介绍 的 随机 变量 。 随 机 变量 
是 指 从 随机 试验 中 得 到 具体 的 数值 结果 。 比 如 ， 当 你 掷 蜗 子 时 你 可 以 用 随机 变量 
表示 结果 ， 结 果 的 数值 从 1 到 6 中 取 。 假 设 你 搓 了 十 次 仍 子 ， 你 会 得 到 十 个 数 
值 。 在 进行 试验 之 前 你 可 以 用 随机 变量 XX，X,，…，Xio 来 表示 。 从 某 种 意义 上 
来 说 这 些 变量 是 一 样 的 ， 因 为 它们 是 同一 个 试验 的 结果 ， 所 以 得 到 相同 数字 的 概 
率 也 是 相等 的 。 我 们 称 它们 是 恒 等 分 布 的 。 但 是 从 另 一 方面 来 说 它们 都 是 不 一 样 
的 ， 因 为 每 一 次 试验 出 现 的 数字 可 能 是 从 1 到 6 中 的 任何 一 个 数字 ， 与 其 他 试验 
并 不 相关 。 我 们 称 它 们 是 独立 的 (第 1 章 中 介绍 的 独立 事件 ) 。 

因为 结果 的 独立 性 和 恒 等 分 布 ， 我们 可 以 用 随机 变量 来 描述 很 多 类 型 的 重复 
试验 观察 到 的 结果 。 我 们 还 是 先 用 投 般 子 作为 例子 。 现 在 我 们 要 用 的 是 关于 平均 
数 的 定律 。 前 次 随机 变量 的 平均 数 用 并 表示 ， 公 式 为 

二 十 有 十 … 十 大 


n 








大 数 定律 告诉 我 们 随 着 不断 变 大 ，X 趋 近 于 3.5， 换 而 言 之 ， 只 要 n 足够 大 X 就 
会 无 限 接近 3.5。 但 是 这 看 起 来 还 是 有 些 问 题 。 比 如 我 们 在 什么 时 候 可 以 确定 平 
均 数 在 3.4 ~3.6 之 间 呢 ? 1000 次 之 后 吗 ? 还 是 10000 次 ? 但 是 我 们 怎么 能 保证 
不 会 掷 出 大 量 的 5 和 6， 从 而 导致 平均 数 高 于 3.6 呢 ? 好 吧 ， 我 们 不 能 保证 。 我 
们 无 法 保证 从 现在 开始 平均 数 一 定 会 在 3.4 ~3.6 之 间 ， 但 是 我 们 可 以 保证 随 着 
n 的 不 断 变 大 ， 这 个 结论 越 来 越 可 能 。 比 如 ， 当 n 等 于 多 少时 ， 才 能 至 少 保证 X 
在 3.4 ~3.6 之 间 的 概率 不 低 于 99%? 用 数学 公式 来 表示 的 话 ， 我 们 现在 要 计算 


出 的 值 使 其 满足 P(3.4<X<3.6) 三 0. 99 或 者 是 满足 P( |X -3.5| 友 0.1) 三 0. 99， 
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我 们 很 难 解 出 这 个 不 等 式 。 那 么 先 来 了 解 一 下 X 吧 。 它 的 期 望 值 和 方差 是 多 少 呢 ? 
因为 X 是 通过 随机 变量 和， 筷 ，…， 来 计算 的 ， 所 以 它 本 身 也 是 一 个 随机 变 
量 。 那 么 X 就 有 期 望 值 和 方差 。 我 们 注意 到 的 值 可 以 通过 ，X,，…，X 之 和 
除 以 n 计算 出 来 。 运 用 第 5 章 介 绍 的 期 望 值 和 方差 的 性 质 ， 可 以 知道 XX + 处, +…: 
+ 的 期 望 值 等 于 3.5 +3.5+… +3.5 =n x3.5。 接 着 又 因为 X 的 值 可 以 通过 
久 ， 访 , ，…，X, 之 和 除 以 n 计算 出 来 ,依据 期 望 值 的 线性 特征 可 以 计算 出 X = 
nx3.5/n=3.5。 所 以 找 n 次 的 平均 期 望 值 与 一 次 的 期 望 值 是 一 样 ， 只 要 你 想 一 
想 就 会 觉得 不 足 为 奇 。 经 过 上 一 章 的 学 习 我 们 算出 掷 一 次 货 子 的 方差 是 2.9， 由 
于 方差 的 可 加 性 ，X + 和 +… +XX, 之 和 的 方差 等 于 nx2.9。9 最 后 在 计算 《的 方 
差 时 要 记 住 方差 并 不 是 线性 的 ， 而 是 以 平方 数 增加 。 在 这 个 例子 中 ， 由 于 XX 是 用 和 
除 以 n 得 到 的 ， 所 以 的 方差 就 需要 用 方差 之 和 除 以 吕 ， 即 2.9/n。 总 结 一 下 ， 
n 次 游戏 之 后 平均 数 的 期 望 值 是 3.5，, 方差 是 2.9/n。 我们 注意 到 随 着 n 的 增 大 ， 
的 方差 迅速 减 小 。 这 说 明了 随 着 次 数 的 增加 的 随机 性 越 来 越 小 ， 不 断 接近 3. 5。 

目前 为 止 没 有 任何 问题 ,但 是 我 们 想 要 进一步 解释 。 这 里 我 们 要 对 切 比 雪夫 说 
声 抱 炊 ， 因 为 在 第 5 章 中 我 们 并 没有 认真 介绍 切 比 雪夫 不 等 式 ， 而 现在 它 要 真正 发 
挥 作 用 了 。 切 比 雪夫 告诉 我 们 随机 变量 在 期 望 值 w 的 次 标准 差 之 间 的 概率 至 少 为 
1 -1 。 在 现在 这 个 例子 中 ， 随 机 变量 为 X， 其 期 望 值 为 3.5， 方 差 为 2 9%n。 所 
以 标准 差 为 V2.9/n 二 1.7/Yn。 将 这 些 数 据 代入 切 比 雪夫 不 等 式 可 得 

P(X -3.5|<Ex1.7/Vn) =1 -1/k 











这 与 我 们 之 前 得 出 的 不 等 式 P(|X -3.5|<0.1) =0.99 非常 相似 。 现 在 n 
是 我 们 所 求 的 未 知 数 。 对 比 这 两 个 不 等 式 右边 的 部 分 可 知 我 们 要 将 设 定 为 





G@ 在 5.5 节 的 脚注 中 提 到 过 方差 的 可 加 性 。 当 时 提 到 的 “限制 ”就 是 指 方差 的 独立 性 。 如 果 它 们 不 独 
立 ， 那 么 方差 就 不 具有 可 加 性 。 假 设 并 是 掷 货 子 可 能 出 现 的 结果 ， 我 们 将 它 翻 倍 变 成 2 xX， 这 个 翻 
倍 之 后 的 结果 也 有 方差 ， 是 原来 方差 的 四 倍 即 4x2.9 =11.6。 因 为 2xXX 可 以 改写 成 +， 此 时 方 
差 并 不 等 于 2.9 +2.9 =5.8， 所 以 在 这 个 例子 中 方差 是 没有 可 加 性 的 。( 显然 X 是 不 独立 的 。) 















































第 6 章 必然 概率 : 两 个 迷人 的 数学 结论 


10(1 - 1Z100 =0. 99)。 不 等 号 左边 的 部 分 则 告诉 我 们 必须 要 令 x1.7/Vn 的 值 等 
于 0.1。 因 为 k=10， 所 以 17/Vn =0.1， 则 vn =170， 从 而 得 出 n=170? =28900。 
四 舍 五 人 将 nn 看 成 29000。 你 需要 至 少 掷 29000 次 角子 才 可 以 保证 平均 数 在 3.4 ~ 
3.6 之 间 的 概率 为 99% 。 需 要 进行 的 次 数 太 多 了 ， 我 们 就 不 实际 操作 来 求证 了 。 
举 这 个 例子 是 为 了 说 明 : 不 论 在 哪 一 个 区 间 范 围 内 ， 取 多 少 程度 的 确定 概率 ， 我 
们 都 可 以 计算 出 n 的 值 。 这 个 例子 中 区 间 是 以 3.5 为 中 心 ， 距离 0.1， 概 率 为 
99% 的 确定 ， 其 他 任何 数据 也 是 可 以 计算 出 来 的 。 比 如 ， 我 们 可 以 计算 保证 平均 数 
在 3. 45 ~3.55 之 间 达 到 99. 9% 的 可 能 性 时 ， 我 们 必需 至 少 掷 1160000 次 。 

让 我 们 回归 到 一 般 的 情况 中 。 现 在 我 们 有 独立 的 、 正 态 分 布 的 一 组 随机 变量 
XX， ，X,，…。 每 个 变量 的 期 望 值 都 是 久 ， 方 差 都 是 a?。 所 以 平均 数 X 也 有 相同 的 
期 望 值 六 ， 方 差 o*， 标 准 差 o/Vn。 我 们 可 以 再 一 次 计算 得 出 要 保证 平均 数 革 在 
俯 -0.1 和 +0.1 区 间 之 内 的 概率 至 少 为 9% ,，n 必须 至 少 为 10000 xo*。 这 个 结 
论 对 于 所 有 的 人 和 ec- 都 适用 。 读 者 们 需要 注意 mn 的 大 小 受到 or 的 影响 。 但 
o? 变 大 时 ， 我 们 需要 增加 更 多 的 变量 来 抑制 X 的 可 变性 。 

接 下 来 是 最 后 一 个 问题 。 在 数学 证 明 过 程 中 ， 我 们 不 会 随便 赋值 。 我 们 通常 
都 会 用 任意 固定 常数 来 表示 与 期 望 值 的 距离 和 确定 的 程度 ， 并 用 变量 来 俞 名 。 现 
在 令 与 的 距离 为 = (希腊 字母 “epsilon”) ， 令 确定 的 程度 为 1 -5 (希腊 字母 
“delta”) 。 在 数学 中 当 数 字 非 常 小 时 我 们 习惯 于 用 e 和 6 表示 具体 的 数字 。 现 在 
我 们 对 小 距离 和 大 概率 (6 很 小 ) 非常 感 兴趣 。 因 此 我 们 想 要 计算 当 平 均值 X 在 
-2 和 凡 +e 区 间 之 内 的 概率 至 少 为 1 -6 时 的 概率 。( 我 们 无 时 无 刻 不 在 做 数学 
题 : 概率 通常 在 0 ~1 之 间 ， 不 用 百分数 表示 。 但 是 如 果 你 坚持 要 用 百分数 来 表 
示 的 话 ， 你 可 以 用 100 x (1 -6)%。) 我 们 可 以 得 到 下 面 的 不 等 式 : 

P(|X -| se) 三 1 -6 
又 因为 切 比 雪夫 不 等 式 在 平均 值 X 上 的 运用 告诉 我 们 

P(X -nu| kxo/Nn) 1 -1/k’ 
同样 通过 对 比 这 两 个 不 等 式 不 等 号 的 右边 部 分 ,我们 可 以 知道 =1/Y6 (6 从 一 
开始 就 是 一 个 固定 的 值 )。 通 过 不 等 号 左边 部 分 的 对 比 和 儿 的 值 可 以 得 到 
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8 =0/ Vn x6。 解 这 个 等 式 ， 得 到 n 宇 go*/(6xe*) (这 里 出 现 “ 三 ”是 因为 n 必 
须 是 一 个 整数 ) 。 具 体 到 投 蜗 子 的 例子 中 ,wx =1.7, e =0.1, 6=0.01 (读者 可 
以 自己 计算 一 下 )。 

到 目前 为 止 我 们 知道 了 不 论 = 和 6 的 值 有 多 小 ， 只 要 足够 大 就 可 以 确保 平 
均 数 在 凡 -es 和 +s 区 间 之 内 的 概率 至 少 为 1 -5。 你 想 要 确保 平均 数 在 人 -0.5 
和 及 +0.5 区 间 之 内 的 概率 为 95%? 没 问 题 ， 很 简单 。 这 意味 着 e =0.5，6 = 
0. 05， 因 为 17X(0.05 x0.5?) =80， 你 只 需要 保证 至少 为 80 xc 就 可 以 了 。 那 
么 99% 的 概率 呢 ? 也 没 问 题 ， 只 不 过 n 要 至 少 为 400 x o。 概 率 至 少 为 100 x 
(1 -6)% 呢 ?只 要 保证 次 数 不 低 于 4 xo /6。 

你 也 许 听 过 序列 的 “收敛 性 ”这 个 概念 。 当 随 着 n 的 不 断 变 大 ， 序 列 x ， 
x,，… 的 值 不 断 向 x 靠近 ，x, 会 无 限 趋 近 于 x。 对 于 任何 的 来 说 ， 当 nn 足够 大 
时 ， 绝 对 值 |x, -x | 肯定 会 小 于 a。 当 我 们 说 “ 随 着 n 逐渐 趋 于 无 穷 ，x, 会 无 限 
趋 近 于 x”， 此 时 记 作 “n 一 ww ， 则 x, 一 x”。 (数字 被 称 为 序列 的 极限 。) 例如 ， 
序列 |1/n, n=1，2,…| (这 个 序列 为 1，1/2,，1/3,，…) 向 0 收敛。 无 论 
2 有 多 小 ， 当 1n 比 1/s 大 时 ，1/n 都 会 小 于 e (都 是 序列 中 后 来 的 数 )。 在 3.5 节 
中 我 提 到 了 序列 (1 - 1) "会 不 断 向 e- 收敛。 这 个 例子 也 可 以 通过 和 6 来 证 
明 ， 这 里 就 不 详细 解释 了 。 现 在 用 连续 平均 数 作为 序列 来 考虑 一 下 吧 。 这 个 序列 
会 不 断 接近 yw， 但 却 不 同 于 序列 1]m 接近 0 的 方式 ， 也 不 同 于 序列 (1 -1/n)” 接 
近 e” 的 方式 。 昌 然 我 们 无 法 确定 平均 数 与 4 的 距离 是 否 为 ,但 是 平均 数 定律 
告诉 我 们 ， 当 选择 的 n 足够 大 时 这 种 情况 发 生 的 概率 非常 高 。 我 们 依然 可 以 说 
向 收敛 ， 但 是 必须 要 加 上 “ 依 概 率 ” 这 个 限定 词 。 因 此 ， 当 你 反复 投掷 货 子 
的 时 候 ， 连 续 平均 数 依 概率 向 3.5 收敛 ; 如 果 是 反复 进行 扔 硬币 试验 ， 则 正面 朝 
上 连续 相对 频率 的 序列 依 概 率 向 0.5 收敛 。 我 们 现在 面 对 的 是 随机 现象 ， 总 是 可 
以 得 到 好 的 结果 。9 




















。 事 实 的 情况 会 更 好 一 些 ， 概 率 学 家 们 有 时 还 将 这 种 情况 称 为 “几乎 必然 收敛 "。 这 就 意味 着 一 定 
会 有 一 个 使 得 能 够 满足 。 和 /的 要 求 ; 只 不 过 我 们 无 法 提前 知道 是 多 少 。“ 几 乎 ”一 词 说 
明 依然 存在 一 些 极端 的 情况 不 收 货 ， 比 如 掷 仍 子 每 次 结果 都 是 6， 那么 这 组 序列 就 不 会 向 3.5 收 
敛 。 但 是 这 些 情况 几乎 永远 不 会 发 生 (发 生 的 概率 为 0) 。 虽 然 本 书 无 法 详 述 ， 但 收敛 的 不 同类 型 
一 直 是 概率 理论 中 永恒 的 迷人 话题 。 
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在 6. 1 节 的 脚注 中 我 说 过 相对 频率 可 以 用 平均 数 来 解释 ， 概 率 可 以 解释 为 其 
望 值 。 这 也 就 意味 着 我 们 之 前 证 明 过 的 某 一 事件 的 连续 相对 频率 也 可 以 说 每 次 发 
生 的 概率 pp 依 概率 向 p 收 僵 。 相 对 频率 的 稳定 仅仅 是 大 数 定律 的 一 种 特殊 形式 。 
最 早 证 明 出 这 一 点 的 是 雅 各 布 . 但 努 利 。 由 于 在 18 世纪 早期 他 还 不 知道 切 比 雪 
夫 不 等 式 ， 所 以 他 的 证 明 过 程 比 我 们 的 证 明 的 过 程 要 复杂 得 多 。 俄 国 数学 家 们 在 
20 世纪 时 证 明了 大 数 定 律 的 许多 通用 的 形式 ， 最 著名 的 是 安 德 雷 ' 柯 尔 莫 哥 洛 
夫 ， 他 是 现代 概率 学 理论 之 父 。 














6.5 钟 形 曲线 与 烤 面包 的 故事 


你 可 能 以 前 就 见 过 用 一 条 钟 形 的 曲线 来 描绘 各 种 各 样 的 数据 ， 如 树干 的 宽 、 
每 袋 坚 果 的 重量 、 股 票 市 场 的 浮动 、 光 的 强度 、 天 文 测 量 中 的 错误 以 及 智商 。 这 
条 曲线 叫做 “ 正 态 分 布 ”或 “高 斯 分 布 ” 。 这 两 个 名 字 听 起 来 都 有 些 勉强 。 那 些 
没有 正 态 分 布 的 数据 一 点 也 不 反常 ， 而 数学 王子 (没有 人 被 称 为 数学 国王 ) 卡 
尔 . 弗 里 德里 希 . 高 斯 (1777 一 1855) 也 没有 发 现 钟 形 曲线 。 在 他 出 生前 半 个 世 
纪 ， 法 国 数学 家 棣 莫 弗 (1667 一 1754) 在 1718 年 出 版 了 《机 遇 论 》 (The Doctrine 
of Chances) ， 首 次 描绘 了 钟 形 曲线 。 

我 们 的 朋友 弗朗西斯 . 高 尔 顿 需 士 

最 早 提出 用 “ 正 态 分 布 ” 来 给 钟 

形 曲 线 合 名， 这 也 是 如 今 我 们 这 

些 概率 学 家 和 统计 学 家 最 常用 的 

术语 。 但 工程 师 和 科学 家 们 似乎 

更 喜欢 用 “高 斯 分 布 ”。 那 么 ， 名 
字 中 蕴含 了 什么 呢 ? 从 现在 开始 图 6-9 正 态 分 布 的 钟 形 曲线 

我 们 将 称 其 为 正 态 分 布 ， 钟 形 曲 

线 被 称 为 其 他 名 字 依 然 不 会 改变 形状 。 如 图 6-9 所 示 ， 它 是 一 条 非常 完美 、 平 
滑 的 曲线 。 

虽然 高 斯 没有 发 现 钟 形 曲线 ， 但 是 他 注意 到 了 测量 的 误差 ， 比 如 天 文 测量 中 
的 误差 依据 钟 形 曲线 分 布 ， 从 而 广泛 的 使 用 了 钟 形 曲线 。 在 统一 使 用 欧元 之 前 ， 
德国 十 马克 的 纸币 上 有 高 斯 的 头像 和 一 条 钟 形 曲线 图 ， 甚 至 还 有 描述 这 条 曲线 的 
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数学 等 式 。 等 式 本 身 没 有 钟 形 曲线 那么 吸引 人 
| 
fn- 

在 我 们 跳 过 这 个 等 式 之 前 还 有 一 些 值得 注意 的 地 方 。 等 式 中 的 表示 的 期 望 值 位 
于 曲线 的 中 央 。o 表示 标准 差 。 正 态 分 布 中 在 第 一 、 二 、 三 标准 差 的 概率 分 别 
为 68% ，95% 和 99.7% 。 要 利用 曲线 计算 概率 我 们 必须 考虑 曲线 之 下 的 面积 。 内 
是 对 称 曲线 的 中 间 点 ， 所 以 曲线 超过 部 分 的 面积 占 总 面积 的 50% 。 从 -8 和 
人 +6 区 间 的 面积 占 整 个 区 域 的 68% 。 因 此 ， 在 区 间 人 + 上 36 以 外 的 范围 非常 的 小 ， 
在 区 间 j+66 之 外 的 面积 只 有 十 亿 分 之 二 。 所 以 如 果 你 已 经 创造 出 一 个 符合 正 态 
分 布 ， 而 你 需要 观察 区 间 人 +66 之 外 的 事件 ， 你 会 知道 这 个 事件 几乎 不 可 能 发 
生 ， 或 者 你 创造 的 过 程 有 问题 ， 你 最 好 重新 检查 一 次 。 这 种 方法 就 是 统计 质量 控 
制 ， 在 近 几 十 年 它 被 广泛 地 运用 在 各 个 领域 ， 挽 救 了 许多 公司 的 重大 损失 。“Six 
Sigma” 是 摩托 罗拉 公司 的 注册 商标 ， 它 逐渐 发 展 进化 成 为 监管 、 控 制 、 改 善 产 
品 和 生产 工艺 的 一 种 方法 。 现 在 有 Six Sigma 社团 、 学 院 和 会 议 ， 你 甚至 还 能 得 
到 一 个 Six Sigma 黑 带 (这 与 绿 腰带 可 不 同 ) 。 不 管 Six Sigma 如 何 发 展 壮大 ， 它 
最 开始 起 源 于 对 正 态 分 布 的 思考 。 

最 后 我 们 需要 注意 到 钟 形 曲线 等 式 中 包含 了 数字 wm。 同样 ， 这 里 并 没有 出 现 
圆 也 没有 进行 投 针 。 它 就 是 突然 出 现 的 。 如 果 阿 基 米 德 看 到 了 这 个 公式 ， 他 一 定 
非常 开心 。 

那么 站 跟 正 态 分 布 有 什么 关系 呢 ? 如 果 你 不 断 重 复 测量 ， 并 将 结果 画 成 图 ， 
画 出 来 的 图 会 跟 钟 形 曲线 很 像 。 我 们 之 前 说 过 钟 形 曲线 非常 的 完美 、 平 滑 ， 但 现 
实 画 出 来 的 图 却 并 不 如 此 。 但 我 们 也 只 是 强调 它 与 钟 形 曲线 非常 类 似 ， 而 并 不 是 
说 得 到 的 就 是 钟 形 曲线 ， 尤 其 是 按照 多 次 测量 之 后 得 到 的 结果 画 出 的 曲线 与 钟 形 
曲线 非常 相似 。 一 个 经 典 的 例子 就 是 阿尔 伯 特 . 亚伯拉罕 . 迈克 尔 逊 在 1879 年 
对 光速 (单位 是 1000km/s) 进行 了 100 次 测量 。 也 可 以 用 芝加哥 熊 队 2006 年 赛 
季 名 单 上 67 名 成 员 的 身高 作为 例子 。 当 我 们 需要 与 钟 形 曲 线 进行 对 比 时 ， 必 须 
将 测量 的 结果 分 类 。 越 靠近 曲线 的 中 心包 含 的 测量 结果 越 多 。 上 面 举 的 两 个 例子 
从 某 种 意义 上 来 说 是 不 一 样 的 ， 光 速 是 一 个 常量 ， 它 之 所 以 符合 正 态 分 布 是 因为 
测量 的 误差 。 而 球员 们 的 身高 本 身 就 是 有 差异 的 ， 所 以 正 态 分 布 正 好 描述 了 这 些 
身高 差 。 
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299.60 299.85 i 
图 6-10 光速 测量 结果 图 6-11 球员 身高 分 布 
图 6-10 所 示 为 以 1000km/s 为 单位 ， 对 光速 的 100 次 测量 结果 ( 按 速 度 分 

成 了 十 个 等 级 ) 。 图 6-11 所 示 为 以 英寸 为 单位 芝加哥 能 队 67 个 成 员 的 身高 分 

布 ( 按 身高 分 成 了 六 个 等 级 ) 。 

关于 智商 是 否 符合 正 态 分 布 一 直 是 一 个 争论 不 休 的 问题 。 智 商 测试 是 以 100 
为 期 望 值 ，15 为 标准 差 来 设计 的 。 一 半 的 人 智商 会 高 于 100， 一 半 的 人 会 低 于 
100; 68% 的 人 智商 在 85 ~ 115 之 间 ，95% 的 人 智商 在 70 ~ 130 之 间 。 只 有 2. 5% 
的 人 智商 高 于 130 (70 ~ 130 区 间 有 95% 的 人 ， 剩 下 的 5% 被 70 以 下 的 区 间 和 
130 以 上 的 区 间 平 分 了 )。 还 记得 玛丽 莲 : 沃 斯 : 莎 几 特 吗 ? 她 保持 着 最 高 的 智 
商 纪 录 228 ， 偏 离 了 期 望 值 8. 5 个 标准 差 ! 要 超过 玛丽 莲 的 纪录 的 概率 实在 是 太 
小 了 ， 所 以 她 大 概 余生 都 不 用 担心 纪录 会 被 别人 打破 。 因 为 智商 测试 的 分 数 是 遵 
循 正 态 分 布 曲线 的 ， 所 以 “ 按 曲线 来 打分 ”也 是 依据 正 态 分 布 进行 的 。 但 作为 
一 个 老师 ， 我 不 认为 应 当 像 妈 隶 一 样 恪守 这 条 曲线 。 我 还 深 深 地 记得 高 中 时 一 个 
同学 被 告知 因为 其 他 两 名 同学 得 到 了 最 高 分 ， 所 以 他 不 能 再 得 到 最 高 分 了 。 这 是 
多 么 的 无 知 愚蠢。 但 幸好 我 的 同学 没有 遭受 到 心理 创伤 ， 他 现在 是 一 位 杰出 的 神 
经 系统 科学 家 ， 也 非常 擅长 数学 。 

法 国 数学 家 亨利 . 庞 加 莱 (1854 一 1912) 还 有 一 桩 轶 事 。 庞 加 莱 总 是 从 一 家 
面包 店 买 烤 面 包 ， 每 一 块 面包 按 道 理 都 重 一 千克 。 庞 加 莱 称 了 每 一 块 面 包 的 重 
量 ， 并 用 图 描绘 出 来 。 最 终 得 到 的 图 类 似 于 正 态 分 布 ， 其 期 望 值 为 950 克 。 他 向 
警察 抱怨 要 求 面包 店 停止 缺 斤 少 两 的 行为 。 接 下 来 的 一 年 里 ， 庞 加 莱 称 出 来 的 面 
包 重 量 终于 达到 了 一 千克 了 ， 但 是 他 依然 宣称 面包 店 在 欺骗 客户 。 因 为 如 果 按 照 
期 望 值 为 一 千克 ， 庞 加 莱 称 出 来 的 数据 就 不 符合 正 态 分 布 了 。 也 就 是 说 他 测量 出 
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来 的 结果 描绘 的 曲线 符合 期 望 值 为 950 克 的 正 态 分 布 ， 但 是 测量 结果 的 平均 值 却 
为 一 和 干 区 。 庞 加 莱 认 为 面包 的 重量 应 当 遵 循 之 前 的 正 态 分 布 ， 面 包 店 刻意 把 重 一 
点 的 面包 卖 给 数学 家 ， 依 然 在 欺骗 其 他 的 顾客 。 计 算 机 模拟 了 这 个 例子 〈 见 
图 6-12) 。 左 图 是 平均 重量 为 950 克 的 一 百 个 面包 的 重量 分 布 ， 右 图 是 平均 重量 
为 1000 克 ， 一 百 个 重 一 点 的 面包 的 重量 分 布 。 庞 加 羔 在 考虑 这 个 问题 时 不 仅 用 
到 了 平均 值 还 考虑 了 重量 的 分 布 形状 。 虽 然 这 桩 轶 事 告诉 我 们 可 以 用 概率 来 检测 
谎言 ， 但 是 我 却 怀疑 其 真实 性 。 哪 一 个 法 国人 会 买 回 一 块 面包 还 要 回 家 称 一 称 重 
量 呢 ? 我 觉得 法 国人 会 更 在 意 奶 酷 和 葡萄 酒 是 不 是 足 量 。 此 外 ， 难 道 这 家 面包 店 
店主 和 当地 的 警察 之 前 不 认识 吗 ? 
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图 6-12 庞 加 莱 的 面包 重量 图 
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为 什么 庞 加 莱 的 面包 重量 图 符合 正 态 分 布 呢 ? 我 之 前 提 到 的 坚果 的 数量 有 什 
么 用 呢 ? 为 什么 钟 形 曲线 如 此 频繁 地 出 现 呢 ? 问题 的 答案 在 于 一 个 著名 的 概率 理 
论 。 下 一 节 我 们 将 仔细 介绍 这 一 理论 。 


6.6 多 伦 多 梅花 形 是 如 何 改变 我 的 人 生 的 


这 一 他 的 题目 带 来 了 两 个 问题 : 中 什么 是 梅花 形 ? @ 多 伦 多 的 一 个 事物 为 什 
么 可 以 改变 人 的 一 生 ? 让 我 来 快速 回 到 第 二 个 问题 。 我 认为 多 伦 多 是 一 个 迷人 的 
城市 ， 它 有 很 棒 的 葡萄 牙 餐 厅 、 完 善 的 公共 交通 和 美丽 的 枫叶 。 显 然 第 一 个 问题 
更 有 意思 。 梅 花形 是 在 一 块 板 上 用 钉子 钉 出 的 一 种 工具 ， 它 们 形成 了 一 个 大 三 角 
形 : 最 顶端 一 枚 钉子 ， 在 它 下 面 两 枚 箱子， 再 往 下 是 三 枚 钉子 ， 如 此 类 推 。 把 一 
块 玻璃 板 窗 盖 在 这 些 钉 子 之 上 后 ， 把 它 竖 直 地 放置 ， 形 成 一 个 奇妙 的 装置 。 梅 花 
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形 ， 按 照 字面 上 的 意思 是 指 五 个 圆 点 排列 在 一 块 ， 中 间 一 个 圆 点 ， 其 他 四 点 分 布 
在 四 个 角落 。 我 们 的 梅花 形 小 工具 实际 上 是 由 多 个 小 梅花 形 组 成 的 。 它 还 有 其 他 
的 名 字 比 如 “ 磨 豆 机 ”和 “高 尔 顿 杀 板 ”。 弗 并 西 斯 最 先 设 计 出 这 个 小 工具 是 为 
了 说 明正 态 分 布 。 但 是 如 何 说 明 呢 ? 

从 顶端 的 箱子 开始 让 一 个 小 铁 球 自由 地 向 下 落 ， 它 会 随机 向 左 或 向 右 滚 动 。 
当 它 碰 到 下 一 枚 钉子 之 后 又 会 面临 同样 向 左 还 是 向 右 的 等 可 能 选择 。 一 直到 它 最 
后 到 达 底 部 它 才 会 停止 滚动 ， 然 后 落 和 对 应 的 一 排 容器 之 中 。 最 左边 和 最 右边 的 
容 需 最 难 落 入 ， 因 为 它们 都 要 求 小 铁 球 从 一 开始 就 向 同一 个 方向 滚动 ， 所 以 就 只 
有 一 种 完成 方式 。 铁 球 最 容易 落 入 中 间 的 容器 ， 因 为 有 很 多 不 同 的 路 径 可 以 滚动 
至 此 。 随 着 你 不 断 地 在 顶端 放 小 铁 球 ， 你 就 会 发 现 它们 自己 会 依据 钟 形 曲线 滚 向 
最 终 的 容器 。 中 间 的 容 带 铁 球 最 多 ， 逐 渐 癌 两 端 减少 ， 最 左边 和 最 右边 的 容 右 中 
铁 球 最 少 。 

梅花 形 的 例子 诠释 了 概率 中 一 个 重要 的 理论 一 一 “中 心 极限 定理 ”。 假 设 你 
将 大 量 随机 变量 相 加 ， 不 论 原来 的 随机 变量 是 多 少 ， 它 们 的 和 会 趋向 于 正 态 分 
布 。 这 个 定理 在 日 常生 活 中 的 运用 是 指 ， 当 你 要 测量 一 个 由 许多 独立 的 小 事物 组 
成 的 物体 的 值 ， 不 论 这 些小 事物 本 身 怎么 样 9 ， 测 量 值 总 是 会 符合 正 态 分 布 。 庞 
加 莱 的 面包 里 显然 会 包括 面粉 、 盐 、 酵 母 等 东西 ， 这 也 解释 了 他 测量 的 结果 为 什 
么 会 符合 正 态 分 布 。 坚 果 的 数量 也 是 如 此 。 重 量 之 和 就 是 用 每 一 颗 坚 果 的 重量 相 
加 ， 即 使 这 里 可 能 混合 了 小 棒子 或 大 巴西 果 ， 称 出 来 的 结果 依然 会 符合 正 态 分 
布 。 中 心 极 限定 理解 释 了 为 什么 正 态 分 布 如 此 广泛 地 存在 。 只 要 一 个 大 数量 能 够 
被 许多 小 事物 分 解 ， 钟 形 曲 线 就 会 出 现 。 对 于 梅花 形 来 说 ， 最 终 球 的 位 置 就 是 每 
一 步 向 左 还 是 向 右 合 加 的 结果 。 

那么 我 在 多 伦 多 经 历 了 什么 足以 改变 我 的 生活 呢 ? 这 倒 不 是 一 个 多 精彩 刺激 
的 故事 。 我 在 大 学 时 曾经 请 了 一 年 的 假期 ， 和 一 个 朋友 周游 世界 。 我 们 去 过 许多 
非常 具有 有 异域 情调 的 地 方 ， 比 如 萨摩 亚 、 斐 讲 和 汤加 等 ， 然 后 就 在 多 伦 多 停留 了 















































@ ”这 些小 事物 必须 是 可 加 的 。 在 很 多 情况 下 ， 对 这 些 事件 需要 使 用 乘法 法 则 。 比 如 股票 的 价格 会 随 
着 价值 成 比例 改变 。 如 果 你 熟悉 对 数 的 话 ， 你 会 知道 一 个 乘积 的 对 数 等 于 对 数 之 和 ， 所 以 股票 市 
场 数据 的 对 数 相 比 于 数据 本 身 更 符合 正 态 分 布 。 如 果 你 随便 点 击 一 个 金融 网 页 ， 你 会 发 现 股票 、 
基金 、 股 指 的 图 要 么 是 线性 的 要 么 是 以 对 数 为 基础 的 。 
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几 天 。 在 那里 的 一 座 科学 博物 馆 的 展览 中 ， 我 第 一 次 看 到 了 梅花 形 。 一 条 钟 形 曲 
线 呈 现在 玻璃 板 后 面 ， 我 听 到 一 位 父亲 在 向 他 的 儿子 解释 其 中 的 原理 。 在 回 瑞典 
的 途中 我 下 定 决心 要 从 计算 机 科学 转学 概率 。 

中 心 极限 定理 的 证 明 过 程 非常 的 复杂 ， 需 要 用 的 方法 远 远 超出 了 本 书 的 难度 
范围 。 这 样 一 个 复杂 艰深 的 理论 居然 可 以 用 来 解释 这 么 多 生活 中 常见 的 现象 ， 比 
如 庞 加 莱 的 面包 和 高 尔 顿 的 梅花 形 。 中 心 极限 定理 也 让 我 们 可 以 更 加 深入 地 研究 
之 前 介绍 过 的 扔 硬币 游戏 。 因 为 这 个 游戏 是 对 称 的 ， 所 以 如 果 汤 姆 和 哈 利 玩 了 
1000 轮 游 戏 ， 预 期 的 成 绩 是 他 们 打 成 平 局 ， 在 0 线 上 相交 。 但 是 这 个 结果 很 罕 
见 。 我 们 知道 发 生 的 概率 非常 小 ， 其 标准 差 大 约 为 33。 依 据 中 心 极限 定理 ， 我 
们 知道 位 置 接近 正 态 分 布 。 此 外 ， 我 之 前 提 过 在 距离 期 望 值 一 个 标准 差 范 围 内 的 
观察 结果 有 68% 。 对 于 硬币 游戏 来 说 这 就 表示 有 32% 的 概率 ， 游戏 的 三 分 之 一 。 
最 终 游戏 会 以 一 个 玩家 至 少 领先 33 分 而 结束 。n 轮 之 后 的 标准 差 为 yn。 所 以 如 果 
玩 了 10000 轮 ， 那么 汤姆 或 哈 利 其 中 一 人 有 173 的 机 会 最 终 至 少 赢得 一 百 美元 。 

中 心 极限 定理 还 对 大 数 定律 在 平均 数 和 上 进行 了 进一步 补充 。 大 数 定律 告诉 
我 们 XX 无 限 趋 近 于 hj， 而 中 心 极限 定理 告诉 我 们 和 之 间 的 差 符合 正 态 分 布 ， 
其 中 期 望 值 为 0， 标 准 差 为 o/ yn。 因为 相对 频率 是 一 种 特殊 的 平均 数 形 式 ， 所 
以 在 计算 与 X 相 关 的 概率 时 可 以 运用 到 中 心 极限 定理 。 在 计算 萍 丰 投 针 问题 的 概 
率 时 我 用 的 就 是 中 心 极限 定理 。 



































6.7 结语 


大 数 定律 和 中 心 极限 定理 是 概率 论 的 两 大 基石 。 你 也 许 会 说 大 数 定律 没 有 什 
么 稀奇 之 处 ， 如 果 它 出 错 了 才 是 真正 的 奇怪 。 但 是 它 的 确 是 概率 理论 与 现实 世界 
完美 契合 的 一 个 明证 。 我 们 可 以 将 期 望 值 和 概率 解释 成 为 长 期 平均 行为 和 相对 频 
率 (这 也 是 为 什么 称 之 为 “定律 ”而 不 是 定理 )。 相 比 之 下 中 心 极限 定理 就 像 魔 
术 一 样 内 漆 。 但 我 们 研究 那些 被 许多 独立 小 事物 拆 分 的 事物 时 ， 不 管 我 们 襄 不 喜 
欢 (我 们 当然 喜欢 ) ， 钟 形 曲线 总 是 会 和 复杂 的 数学 等 式 适时 出 现 。 大 数 定律 和 
中 心 极限 定理 相辅相成 ， 共 同 协作 解释 了 在 长 期 行为 中 均值 和 相对 频率 会 发 生 什 
么 。 它 们 将 这 个 混乱 复杂 的 世界 变 得 简单 而 富有 秩序 。 
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博彩 中 的 概率 : 
为 什么 唐纳德 . 特 朗 普 比 你 富 





为 什么 庄家 总 是 赢 ? 
从 概率 的 角度 探寻 博彩 业 以 及 保险 业 的 生存 之 道 。 本 章 介 绍 了 多 种 游戏 ， 当 
然 游戏 和 博彩 中 的 问题 早已 打破 了 界限 ， 在 实际 中 有 着 广泛 的 应 用 ， 不 妨 跟 随 作 
者 来 学 习 几 招 吧 ， 至 少 也 要 输 的 明白 | 
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7.1 庄家 的 优势 在 哪里 











只 要 想 一 想 人 们 发 明了 多 少 种 赌博 的 方式 ， 你 就 该 知道 本 章 必 定 应 当 是 本 书 
最 长 的 一 章 。 博 彩 界 权 威 大 师 约 坦克 兰 在 其 1986 年 出 版 的 《博彩 完全 手册 》 中 
总 结 了 所 有 的 赌场 游戏 ,包括 纸牌 、 赛 狗 、 跑 马 、 赌 博 机 等 各 式 各 样 的 玩法 ， 其 
至 还 有 他 自己 发 明 的 小 游戏 。 这 本 书 中 包含 了 很 多 计算 胜率 的 内 容 ， 但 却 不 是 一 
本 介绍 概率 的 书籍 。 此 书 长 达 900 多 页 。 要 是 想 了 解 比 这 本 书 更 深入 详尽 的 概率 
和 赌博 问题 ， 那 么 可 以 参照 之 前 提 过 的 约翰 . 黑 格 的 《机 会 的 数学 原理 : 明知 其 
输 而 博 赢 的 概率 分 析 》 一 书 。 此 书 不 仅 包 括 了 所 有 传统 的 赌场 游戏 ， 还 包括 了 棋 
盘 游戏 如 大 富 公 、 十 五 子 棋 ， 还 有 电视 节目 如 “智者 为 王 ”、“ 谁 要 成 为 百 万 富 
俩 ”等 。 

在 我 们 这 本 书 中 我 只 会 提 及 一 些 浓 见 的 赌场 游戏 。 这 样 的 话 本 章 就 不 会 太 
长 : 根据 大 数 定律 ， 赌 场 必 赢 ， 玩 家 必 输 。 就 是 这 样 。 

首先 ， 即 使 有 大 数 定 律 ， 人 们 依然 去 赌 。 他 们 赌 得 还 不 少 。 仅 仅 在 美国 ， 
赌博 就 已 经 是 个 亿 万 产业 ， 是 各 个 州 、 印 第 安 部 落 、 慈 善 组 织 、 喷 气 机 大 王 唐 
纳 德 . 特 朗 普 收 入 的 重要 来 源 。 蒙 特 卡 罗 有 赌场 ， 英 国 则 有 皇家 阿 斯 科 特 赛马 
会 ， 中 国 澳门 赌场 众多 ， 欧 洲 人 还 会 赌球 ， 阿 拉 斯 加 的 居民 每 个 月 、 每 天 、 每 
小 时 、 其 至 每 分 钟 都 有 人 在 猜测 塔 纳 纳 河 冰 何 时 会 破裂 ， 这 种 情况 太 和 常见 了 。 
还 有 网 上 赌 EM a 

其 次 ， 赌 博 非 常 单纯 地 展示 了 随机 性 ， 这 一 点 吸引 了 很 多 概率 论 者 。 相 对 于 
天 气 或 者 证 券 市 场 这 种 复杂 情况 而 言 ， 在 乐 透 和 轮 盘 赌 中 概率 计算 更 为 简单 和 精 
确 。 赌 博 史 其 实 也 是 一 部 概率 发 展 史 。 在 第 1 章 中 ， 我 就 介绍 了 伽利略 是 如 何 帮 
助 佛罗伦萨 贵族 解决 山子 赌博 难题 的 。 同 时 ， 也 是 另 一 位 贵族 赌 徒 首次 开始 系统 
性 地 研究 概率 ， 他 就 是 法 国人 托 万 . 页 博 (Antoine Gombaud) ， 人 称 赌 徒 德 米尔 
( Chevalier De Mere) 。 

德 米尔 知道 如 果 他 赌 在 四 次 摇 骨 子 的 情况 下 至 少 出 现 一 次 6 点 ， 那 么 他 启 的 
概率 比 赌场 大 。 在 第 1 章 中 我 们 已 经 计算 过 这 种 情况 的 概率 了 ， 鉴 于 现在 已 经 是 
第 7 章 了 ， 我 们 再 来 复习 一 遍 吧 。 因 为 至 少 一 次 6 点 和 完全 不 出 现 6 点 正好 相 
反 ， 根 据 概 率 第 一 法 则 ， 我 们 得 出 : 
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P( 至 少 一 次 6 点 ) =1-P( 无 6 点 ) =1-(5/6)*~~0.52 
那么 德 米尔 就 有 52% 的 可 能 性 获胜 。 另 一 个 备 受 欢迎 的 游戏 是 抛掷 两 颗 仍 子 来 
得 出 一 对 6 点 。 如 果 你 下 注 押 在 至 少 出 现 一 次 对 六 的 情况 下 ， 那 么 你 是 要 抛掷 
几 次 对 自己 才 更 有 利 呢 ? 一 个 古老 的 赌博 准则 称 ， 由 于 掷 两 颗 仍 子 出 现 的 组 合 
是 掷 一 颗 仍 子 可 能 出 现 的 结果 的 六 倍 ， 那 么 要 抛掷 24 次 才能 得 到 一 个 有 利 的 
可 能 性 。 但 是 ， 德 米尔 对 这 些 结论 感到 困惑 ， 于 是 寻求 朋友 布 莱 士 .帕斯卡 
(1623 一 1662) 的 帮助 。 布 莱 士 . 帕斯卡 是 位 有 名 的 数学 家 、 科 学 家 。 他 发 明 
了 机 械 计 算 器 ， 提 出 了 帕斯卡 三 角形 ， 压 强 单 位 Pa 就 是 以 他 的 名 字 命名 的 。 
接着 帕斯卡 又 给 男 一 位 法 国 数学 家 费 马 写 信 ， 这 位 数学 家 发 现 了 世界 上 很 多 重 
要 数学 定理 。“ 费 马 最 后 定理 ”曾经 是 无 法 证 明 的 难题 ， 现 在 已 经 得 到 证 明 ， 
总 共 花 了 200 多 页 的 篇 幅 。 不 管 怎样 ， 帕 斯 卡 写 给 费 马 的 这 封 信 由 此 展开 的 交 
流 沟通 也 成 为 概率 论 的 起 源 。 对 我 们 而 言 ， 只 要 掌握 了 概率 第 一 法 则 解决 德 米 
尔 的 问题 并 不 难 : 一 次 抛掷 得 到 双 六 的 概率 是 1/36， 那么 在 24 次 抛掷 中 至 少 
得 到 一 次 双 六 的 概率 是 
P( 至少 出 现 一 次 双 六 的 情形 ) =1 - (35/36)”* 二 0. 49 

那么 这 场 赌局 ， 德 米尔 获胜 的 概率 不 大 。 

在 通信 中 ， 德 米尔 说 自己 产生 这 个 疑惑 是 因为 在 赌场 上 屡 战 屡 败 ， 而 帕斯卡 
在 信 中 却说 是 德 米尔 的 聪明 才智 让 他 发 现 了 这 个 问题 。 究 竟 这 个 困惑 的 起 源 是 什 
么 我 们 不 得 而 知 。 帕 斯 卡 一 直 在 信 中 称赞 德 米尔 虽然 不 是 一 位 “几何 学 家 ”， 但 
是 “很 有 能 力 ”， 这 点 是 相当 有 缺憾 的 。 有 些 人 称 百 分 之 四 十 九 的 成 功 概率 中 这 
么 小 的 不 利 因素 是 德 米尔 无 法 通过 实际 操作 发 现 的 。 这 一 点 我 不 同意 ， 这 有 两 个 
原因 ， 一 是 从 实用 角度 出 发 ， 二 是 从 数学 角度 出 发 。 从 实用 角度 出 发 来 说 ， 德 米 
尔 每 下 100 个 金币 的 注 ， 庄 家 赢得 5$1 个 ， 他 自己 收回 49 个 。 因 此 ， 庄 家 在 每 
100 个 金币 中 获 益 2 个 ， 即 2% 的 收益 。 在 蒙特 卡 罗 的 赌场 ， 轮 盘 只 有 1.35% 的 
收益 〈 你 可 以 在 红 黑 色 上 下 注 ， 也 可 以 在 奇偶 数 上 下 注 ) ， 这 绝 不 是 什么 公益 行 
为 。 我 们 之 后 还 会 提 到 双 货 子 的 赌局 中 还 会 出 现 庄 家 1.4% 的 一 利 。 我 不 清楚 德 
米尔 那个 年 代 赌 局 的 规模 有 和 多大。 但 很 显然 ， 这 是 特权 阶级 独 有 的 娱乐 方式 ， 庄 
家 2% 的 收益 持续 来 看 也 不 少 ， 而 德 米尔 和 其 他 的 赌 徒 也 有 钱 可 以 继续 玩 下 去 。 

而 从 数学 角度 来 分 析 这 个 问题 ， 解 释 便 更 有 说 服 力 。 如 果 你 有 一 笔 小 小 的 启 
动 资金 并 且 打 算 玩 到 要 么 赚 一 倍 要 么 输 完 ， 通 过 计算 可 以 知道 输 完 的 概率 。 这 取 
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决 于 你 每 一 次 游戏 获胜 的 概率 ， 即 单 局 获胜 概率 。 那 么 假设 ， 你 先 拿 出 5 个 金 
币 ， 抛 搓 两 枚 仍 子 ， 出 现 至 少 一 次 六 的 概率 是 49% ， 那 么 可 以 得 出 输 完 的 概率 
是 54% 。 如 果 德 米尔 真 的 相信 那 条 古老 的 赌博 规则 ， 那 么 获胜 的 概率 就 该 为 
52% ， 输 完 的 概率 只 有 41% 。 如 果 德 米尔 一 次 又 一 次 地 玩 下 去 ， 那 么 他 就 会 知道 
54% 和 41% 的 差别 了 。 如 果 赌 钱 是 10 个 金币 ， 那么 对 应 的 概率 就 是 59% 和 
33% ， 这 样 的 差别 更 为 显著 了 。 如 果 本 金 是 100 个 金币 的 话 ， 那 么 启 率 就 是 
52% ， 这 当然 可 以 保证 赌 者 在 输 光 前 绝对 能 赚 到 翻 一 番 。 这 种 情况 的 概率 是 
99. 97% ， 就 是 说 3000 个 赌局 中 只 有 一 个 赌 徒 会 先 破 产 。 与 其 相反 ， 如 果 赢 率 是 
49% ， 那 么 97% 的 可 能 是 先 破产 。 在 这 里 我 想 指出 ， 这 种 情况 即使 只 出 现 一 次 ， 
也 足够 让 人 产生 疑虑 。 在 下 文中 我 会 详细 解释 这 样 的 算法 。 当 然 德 米尔 是 赌博 了 
无 数 次 才能 证 实 这 一 点 。 根 据 计算 ， 如果 赌局 是 100 个 金币 一 盘 的 话 ， 直 到 他 输 
光 或 是 赢 一 倍 ， 那 要 花 2500 个 金币 。 既 然 ， 赌 局 进行 得 很 快 ， 他 也 有 时 间 ， 也 
不 用 向 谁 交代 ， 那 么 为 什么 不 财 呢 ? 

很 有 趣 的 一 点 是 ， 即 使 庄家 在 每 一 局 游戏 中 的 优势 是 这 么 小 ， 但 也 会 使 他 们 
在 长 期 中 收益 巨大 。 这 一 点 对 想 经 营 赌场 的 人 来 说 非常 重要 。 赌 局 必须 偏向 于 庄 
家 但 是 幅度 也 不 能 太 大 ， 和 否则 没有 人 会 来 玩 的 。 即 使 优势 很 小 ， 长 期 下 来 也 会 是 
一 笔 不 错 的 收益 。 在 德 米尔 的 时 代 里 ， 赌 徒 们 受到 古老 的 赌博 规则 的 影响 ， 认 为 
双 山 子 游戏 是 对 庄家 不 利 的 。 即 使 是 现在 我 们 都 知道 赌场 是 只 鳃 不 亏 的 ,但 是 因 
为 每 场 赌局 的 损失 都 很 小 ， 我 们 还 是 会 认为 自己 有 很 大 几率 可 以 赢 ， 甚 至 会 将 数 
学 常识 抛 之 脑 后 认为 可 以 从 庄家 那里 大 捞 一 笔 ， 这 种 想法 大 错 特 错 。 

德 米尔 同时 也 抛 出 了 另外 一 个 难题 给 帕斯卡 : 点 数 难 题 。 假 设 汤 姆 和 哈 利 玩 
扔 硬币 的 游戏 ， 扔 到 正面 时 哈 利 得 一 分 而 反面 时 汤姆 得 一 分 。 假 设 他 们 每 人 下 注 
50 美元 ， 第 一 个 得 到 六 分 的 人 赢得 游戏 。9 次 之 后 ， 哈 利 以 5:4 暂时 领先 。 局 势 
很 紧张 。 便 币 再 一 次 被 抛 起 …… 但 不 幸 落 入 水 沟 里 。 他 们 没有 其 他 的 硬币 了 ， 决 
定 怎样 来 分 钱 。 汤 姆 认为 游戏 没有 结束 ， 每 人 应 该 拿 回 50 块 。 哈 利 却 认为 自己 
在 之 前 的 比赛 中 领先 ， 他 该 得 到 所 有 的 钱 。 汤 姆 立刻 反对 ， 哈 利 只 是 以 五 比 四 领 
先 ， 他 们 最 多 只 能 以 五 比 四 来 分 ， 这 样 的 话 哈 利 得 56 美元 ， 汤 姆 得 44 美元。 

帕斯卡 和 费 马 都 不 赞同 这 些 解 决 办 法 。 在 他 们 的 信件 中 ， 他 们 想到 了 一 种 巧 
妙 的 解决 办 法 : 赌注 按照 游戏 继续 时 双方 各 自 获 胜 的 概率 进行 分 配 。 只 有 两 次 都 
抛 到 正面 ， 汤 姆 才能 获胜 ， 这 样 他 赢 的 概率 是 1/4 ， 哈 利 获胜 的 概率 是 3/4 ， 即 
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哈 利 获胜 的 概率 是 汤姆 的 三 倍 ， 他 应 得 的 钱 就 是 汤姆 的 三 倍 。 这 样 ， 哈 利 应 得 
75 美元 ， 汤 姆 应 得 25 美元 。 这 样 的 分 法 非常 合理 。 如 果 从 5:4 的 比分 开始 玩 ， 
那么 每 四 轮 游戏 中 平均 汤姆 获胜 一 次 ， 哈 利 获胜 三 次 ,这样 哈 利 最 后 赢 的 就 是 
汤姆 的 三 倍 。 这 个 聪明 的 法 国人 想到 这 办 法 是 唯一 一 种 符合 期 望 值 概念 的 分 配方 
法 ， 这 也 是 第 一 例 复 杂 概 率 推理 。 任 何 一 个 法 国 贵族 赌 徒 都 可 以 尝试 去 计算 各 种 
赌注 的 赔 率 ， 但 是 这 种 点 数 问 题 却 需要 聪明 的 头脑 想 出 一 些 真正 创新 性 思维 。 用 
帕斯卡 的 话 来 说 : 
能 达成 共识 让 我 欣喜 若 狂 。 这 个 真理 不 管 在 图 卢 效 还 是 巴黎 都 是 成 立 的 。 
一 一 帕斯卡 于 1654 年 7 月 写 给 费 马 的 信 
作为 旁 注 不 得 不 感叹 数学 发 展 了 这 么 长 的 时 间 才 与 概率 游戏 结合 起 来 。 那 些 
杰出 的 古 希 腊 数 学 家 们 也 非常 喜欢 玩 贷 子 ， 却 从 未 试 过 把 数学 融入 这 些 游戏 中 。 
也 许 这 些 人 觉得 骨 子 这 种 世俗 随机 的 事物 无 法 与 纯粹 的 数学 家 们 联系 起 来 。 也 许 
他 们 认为 数学 只 能 处 理 一 些 绝对 的 、 藉 止 的 事物 。 但 是 不 管 出 于 何 种 原因 ， 概 率 
理论 直到 文艺 复兴 时 期 才 出 现 。 十 分 有 趣 的 是 ， 这 样 一 群 闲 来 无 事 玩 玩 人 般 子 打发 
时 间 的 贵族 开启 的 概率 理论 先河 ， 在 今天 看 来 却 有 如 此 实用 的 意义 。 






































7.2 轮 盘 : 优雅 地 散 财 











有 人 认为 是 帕斯卡 发 明了 轮 盘 ， 也 有 人 称 一 个 法 国 和 尚 为 了 冲破 庙宇 的 专权 
统治 而 发 明 轮 盘 (如 果真 是 这 样 ， 那么 他 一 定 没 有 意识 到 轮 盘 的 数字 总 和 为 
666)。 也 有 人 声称 轮 盘 起 源 于 中 国 一 个 古老 游戏 ， 但 这 种 说 法 没有 什么 充分 的 支 
持 证 据 。 可 以 确定 的 是 19 世纪 时 ， 轮 盘 在 欧洲 和 美国 流传 ， 此 时 法 式 轮 盘 和 美 
式 轮 盘 已 经 有 很 大 的 不 同 了 。 两 种 轮 盘 都 有 数字 0 和 1 ~ 36, 但 是 美国 轮 盘 有 双 
0， 就 是 “00”， 这 样 增加 了 庄家 赢 的 概率 ( 据 我 所 知 ， 美 式 轮 盘 早 于 法 式 轮 盘 ， 
不 知 何 时 欧洲 轮 盘 去 掉 了 双 0) 。 可 以 准确 算出 ,在 美式 轮 盘 中 ， 庄 家 赢 的 概率 
为 5% (更 准确 地 说 是 5.26% ) ， 而 欧洲 轮 盘 的 庄家 赢 的 概率 是 2.7% 。 欧 洲 轮 
盘 和 美式 轮 盘 下 注 规则 一 样 ， 但 是 由 于 少 了 “00” 的 情况 ， 玩 家 们 赢 的 概率 要 
稍微 好 一 些 。 举 个 例子 ， 如 果 你 在 奇数 上 押 1 美元 ， 那 么 你 有 18737 的 概率 会 
启 ，19737 的 概率 会 输 ， 则 预期 收益 为 

1 x18/37 +( -1) x19/37 = -1/37~ -0.027 
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庄家 收益 率 就 是 2.7% 。 庄 家 预期 百分比 被 称 为 赌场 优势 。 在 押 偶 数 的 情况 下 ， 
赌场 优势 也 是 你 输 的 概率 与 你 赢 的 概率 之 差 。 这 样子 ， 假 设 赢 的 概率 为 pp， 输 的 
概率 为 gq=1 -pp。 因 为 这 些 游戏 对 你 来 说 是 不 利 的 ， 所 以 p <q， 而 你 的 预期 收益 
就 是 
lxp+( -1)xg=p-g 

因此 赌场 优势 就 是 gq -p。 例 如 当 你 有 48% 的 获胜 概率 时 ， 你 每 下 注 100 美元 ， 
就 会 输 52 美元 ,说 48 美元 。 这 意味 着 ， 你 总 共 获 得 $48 + $48 = $$ 和 96， 然后 每 
100 美元 庄家 赚 取 4 美元 即 4% ， 这 也 是 输 的 概率 52% 和 请 的 概率 48% 之 差 。 

某 些 赌场 ， 特 别 是 蒙特 卡 罗 赌 场 ， 有 一 些 特 殊 的 规则 。 当 0 出 现 的 时 候 ， 同 
额 赌注 会 被 暂时 冻结 ， 给 玩家 第 二 次 机 会 。 这 样 就 把 庄家 优势 降 到 了 1.35% 。 当 
然 你 要 知道 一 些 基本 的 规则 ， 当 和 蓓 官 说 “请 下 注 ” 时 你 才能 下 注 ， 当 他 说 “ 买 
定 离 手 ”时 你 就 必须 停止 。 玩 欧式 轮 盘 是 用 法 语 作 为 赌场 语言 的 。 要 是 这 样 太 有 
挑战 性 了 ， 大 西洋 城 转 轮 是 个 不 错 的 替代 品 ， 在 同 额 赌注 的 时 候 ， 只 收取 一 般 的 
赌注 ， 这 样 赌场 优势 变 成 了 2.6% 。 在 欧式 轮 盘 中 下 注 用 的 是 美元 、 英 镑 还 是 瑞 
士 法 即 ? 不 一 定 的 ， 你 在 美国 也 可 以 玩 欧式 轮 盘 的 。 汤 姆 : 埃 斯 利 (Tom Ain- 
slee) 在 其 1987 年 出 版 的 《如 何 玩 转 赌场 》( 了 How to Gamble in a Casino) 一 书 中 
写 道 ， 即 使 美式 轮 盘 前 面 人 满 为 患 ， 欧 式 轮 盘 常常 没有 什么 玩家 ， 这 些 人 在 美式 
轮 盘 上 输 个 精光 却 仍 无 法 自拔 。 

我 在 之 前 的 章节 中 提 到 轮 盘 下 注 中 有 很 多 种 方式 ， 但 是 不 管 怎样 下 注 ， 每 投 
入 1 美元 就 会 损失 5 美 分 。 现 在 我 们 来 看 看 各 种 下 注 方 法 是 如 何 计算 支出 的 吧 。 
最 基础 的 下 注 方法 是 押 单 一 号 码 。 获 胜 的 概率 是 1/38， 在 5.5 节 中 我 们 计算 出 这 
种 下 注 方法 的 预期 收入 是 -2/38。 假 设 你 现在 押 的 是 两 个 数字 ， 即 在 桌面 两 个 临 
近 数 字 之 间 下 注 。 这 些 数字 中 任何 一 个 出 现 ， 你 就 获胜 了 ， 这 样 的 获胜 概率 是 
2/38。 这 是 多 少 呢 ?用 a 来 表示 支出 金额 ， 列 出 预期 收入 的 式 子 , 令 其 等 于 -2/ 
38 ， 再 来 计算 a 的 值 。 这 样 得 出 一 个 等 式 

a x2/38 +( -1) x36/38= -2/38 
左右 两 边 同 时 乘 以 38， 再 把 36 移 到 等 式 右边 ， 这 样 就 可 以 得 到 
2 xa=34 

所 以 你 每 下 1 美元 的 注 需 要 支出 17 美元 ， 也 就 是 17:1。 也 有 很 多 其 他 下 注 方式 。 
三 个 号 码 组 合 投注 于 横行 的 三 个 号 码 上 ， 和 矩形 下 注 选 择 四 个 数字 ,还 有 已 经 介绍 
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过 的 奇数 偶数 下 注 和 黑 红 下 注 。 虽 然 还 有 很 多 种 方式 ， 但 相同 的 是 ， 你 把 钱 押 在 
堆 数字 上 ， 只 要 有 一 个 中 ， 你 就 赢 了 。 我 们 用 wu 来 代表 支出 ， 提 出 一 个 基本 公 
式 。 如 果 投 注 在 n 个 不 同 数字 上 ， 那 么 赢 的 a 的 可 能 性 就 是 w38 ， 输 一 美元 的 概 
率 是 (38 -n)/38。 基 于 预期 收入 是 -2/38 得 到 如 下 等 式 : 
axn/38+( -1) x(38-n)/38 = -2/38 
推出 a=36/n -1， 因 此 nn 个 数字 下 注 的 文 出 = (36/n -1):1。 
在 三 个 数字 组 合 的 情况 下 ，n =3， 依照 公 式 计算 ,支出 是 11:1， 当 n=4 的 时 
修 ， 花费 是 8: 1， 当 n=12 的 时 候 ， 支出 是 2:1。 这 样 你 就 明白 为 什么 一 个 轮 
盘 只 有 36 个 下 注 点 ， 而 不 是 35 或 者 37 个 了 。 当 庄家 收益 是 稳定 不 变 的 ， 因 
为 36 可 以 被 2，3, 4, 6, 9，12，18 整除 ， 任 何 的 下 注 方式 的 支出 计算 都 非 
党 简单 。 
事情 往往 都 有 例外 。 在 一 个 “五 个 数字 线 ” 的 赌局 中 ， 你 选择 五 个 数字 00， 
0, 1, 2 和 3。 此 时 n=5， 所 以 花费 应 该 是 36/5 -1 =6.2， 也 就 是 6.2:1。 但 是 
赌场 绝 不 会 五 五 平分 ， 只 会 接受 6:1。 这 样 获胜 概率 是 5/38， 五 个 数字 线 的 预期 
收益 就 是 











6x5/38 +( -1) x33/38 = -3/38 二 -0.08 

此 时 1 美元 的 投入 就 有 8 美 分 的 可 能 亏损 ， 而 不 是 5 美 分 。 换 句 话说， 轮 盘 中 确 
实 有 一 个 不 错 的 下 注 策略 : 不 要 玩 “ 五 个 数字 线 ”! 牢记 这 一 条 ， 你 的 亏损 就 可 
以 降低 30% ， 这 个 好 意见 可 是 我 友情 无 偿 提 供 的 哦 。 

不 是 所 有 的 人 都 像 你 那么 善良 的 。 一 门 心思 想 要 靠 轮 盘 致 富 的 人 比比 丝 是 。 也 
许 是 些 无 恨 商贩 想 要 向 你 兜售 一 些 东 西 ， 有 时 或 是 真 的 恰 有 其 事 。 有 个 叫 “ 黑 色 系 
统 ”的 方法 一 度 被 称 为 是 轮 盘 神器 。 上 具体 是 这 样 的 : 在 中 间 一 栏 下 注 一 美元 ， 在 黑 
色 下 注 两 美元 。 中 间 栏 的 赔 率 是 2:1， 黑 色 的 赔 率 是 1: 1。 中 间 一 栏 中 有 八 个 黑色 
数字 ， 如 果 抽 到 其 中 任何 一 个 ， 你 就 能 赢 4 美元 〈 押 中 黑色 数字 2 美元 ， 押 中 中 间 
栏 又 得 2 美元 ) 。 如 果 抽 中 剩 下 的 其 他 十 个 黑色 数字 中 任意 一 个 ， 你 就 赢得 1 美元 
( 押 中 黑色 数字 赢得 2 美元 ， 不 是 中 间 栏 的 数字 和 输 1 美元 ) 。 出 现 的 38 个 数字 中 有 
18 个 数字 出 现 都 能 让 你 获胜 。 出 现 平 局 的 也 有 四 种 情况 : 如 果 抽 中 中 间 行 四 个 红 
色 数 字 任 一 个 ， 因 为 不 是 黑色 输 掉 2 美元 ， 因 为 是 中 间 栏 的 数字 又 赢 了 2 美元 。 总 
而 言 之 ， 有 18 种 情况 你 能 获胜 ，4 种 情况 是 平局 ， 只 有 剩 下 的 16 种 情况 时 下 庄家 
才能 得 胜 。 我 知道 这 个 卖点 特别 有 诱惑 力 ， 尤 其 是 那些 数学 不 好 的 赌 徒 面 对 那 些 再 
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灿 莲 花 的 商家 时 很 容易 就 被 串 惑 了 。 但 是 我 们 却 很 快 就 能 发 现 其 中 的 猫腻 : 在 你 输 
的 16 局 中 ， 每 局 都 会 损失 3 美元 ， 这 就 带 来 了 5% 的 赔 率 。 这 些 我 们 从 之 前 学 习 过 
的 期 望 值 知识 就 可 以 知道 ， 但 是 依然 有 人 会 愿意 去 买 。 从 学 术 角 度 看 来 这 是 完全 的 
雇 论 ,但 从 他 们 所 谓 的 经 验 出 发 ， 这 套 方法 可 是 很 有 用 的 呢 。 

最 著名 的 轮 盘 策略 叫做 蒜 〈 译 者 注 : 也 称 为 马丁 格 尔 战 略 ) ,这 个 策略 貌似 
有 用 ， 所 以 很 难 反驳 。 它 要 求 你 对 着 某 一 种 赌注 一 直下 注 ， 并 且 加 售 下 注 直 到 获 
胜 。 开 始 下 注 一 美元 。 如 果 启 了， 继续 ， 抛 开 赢 钱 ， 继 续 玩 下 去 。 如 果 输 了 ， 下 
一 盘 下 注 增 加 到 两 美元 。 再 输 的 话 ， 筹 码 增加 到 4， 到 8， 以 此 类 推 ， 每 次 筹码 
翻 一 倍 。 现 在 ， 红 色 数 字 或 是 0 和 00 都 不 会 总 是 出 现 ， 黑 色 数 字 最 终 会 出 现 ， 
最 后 ， 你 的 赢 钱 会 比 损失 多 一 元 。 比 如 ， 三 次 红色 出 现 之 后 才 出 现 黑 色 ， 这 样 你 
损失 1 +2 +4 =7 美元 ， 那 么 在 第 四 轮 下 注 8 美元 来 赢得 8 美元 。 试 试 其 他 的 值 ， 
这 种 方法 也 同样 适用 。 呢 ， 真 的 吗 ? 

不 一 定 。 这 有 两 个 问题 ， 一 是 实际 问题 ， 二 是 根本 性 问题 。 实 际 问 题 就 是 赌 
场 在 赌 额 方面 是 有 限制 的 。 这 个 战略 中 一 直 不 停 地 投入 两 倍 ， 几 轮 之 后 ， 你 就 超 
过 了 赌场 的 限额 。 如 果 限 制 是 最 少 10 美元 ， 最 高 500 美元 ， 那 么 连 输 六 轮 之 后 ， 
你 就 没 法 在 第 七 轮 压 上 640 美元 了 。 连 输 六 局 的 概率 是 (20/38)" =0.02。 这 个 
数字 虽 小 却 不 容 忽视 ， 在 发 生 这 种 情况 时 你 已 经 输 掉 了 630 美元 了 。 

根本 性 问题 就 是 不 停 地 投入 双 倍 ， 这 样 的 投入 积累 太 快 带 来 了 非常 严重 的 后 
果 : 即使 没有 限额 的 限制 ， 要 实行 这 个 战略 你 必须 十 分 富有 ! 这 似乎 很 荡 座 ,但 
是 很 明显 即使 赌局 公平 公正 ， 但 是 预期 损失 还 是 巨大 。 为 了 方便 计算 预期 值 ， 我 
们 首先 假设 赌局 公平 吧 ， 来 算 算 在 你 赢 钱 之 前 会 损失 多 少 。 如 果 旋 开 得 胜 ， 那 么 
你 就 没有 任何 损失 ， 这 样 的 概率 是 1/2。 如 果 第 二 轮 的 时 候 ， 你 第 一 次 输 掉 1 美 
元 ， 这样 的 概率 是 1/2 x1/2 = 1/4。 在 第 三 轮 中 ， 假 设 你 输 了 1 +2 =3 美元 ,此 
时 的 概率 是 1/8， 以 此 类 推 。 如 果 在 获胜 之 前 失败 次 ， 那 么 你 总 共 损 失 2* - 1 ， 






































在 高 等 概率 理论 中 ， 著 ( 它 的 起 源 是 马术 用 语 ) 的 基本 原理 就 是 一 直 坚持 不 变 。 我 们 在 第 6 章 提 
到 的 对 称 随机 游 走 就 是 一 个 典型 的 例子 。 因 为 它们 向 上 走 或 向 下 走 的 概率 是 相同 的 ， 所 以 平均 说 
来 它们 还 是 会 待 在 原 地 〈 换 名 话说， 变化 的 期 望 值 等 于 0) 。 轮 盘 并 不 是 一 个 严格 对 称 随机 游 走 的 
例子 ， 但 是 这 其 中 的 过 程 非常 类 似 ， 所 以 就 被 称 为 超 轨 (有 利 的 那 一 方 是 赠 场 而 不 是 你 ) 。 但 加 
这 个 称 呼 还 是 传 开 了 。 
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这 样 的 概率 是 1Z24*1。 如 果 大 没有 限制 的 话 ， 那 么 就 可 以 得 到 预期 损失 为 
天 其 损失 = 也 (2 -1) xlZ20 

要 证 明 这 个 和 是 无 穷 的 一 点 也 不 难 ， 这 意味 着 不 断 增加 筹码 ， 总 数 越 来 越 大 没有 
界限 。 和 2 这 个 巨大 的 数字 比 起 来 “ -1” 显 得 很 小 ， 和 1/2”*! 相 乘 之 后 ， 这 样 
我 们 得 到 1/2。 那 么 ，1/2 就 会 被 不 断 地 大 加 ， 总 和 也 变 成 了 无 穷 大 ,这 似乎 有 
点 违反 常理 。 当 你 赢 的 那 一 局 最 终 到 来 时 ， 你 绝 不 会 输 无 数 的 钱 。 但 是 我 们 之 前 
就 了 解 到 期 望 值 不 是 现实 中 的 发 生 值 。 这 种 无 尽 的 预期 损失 的 实际 后 果 就 是 不 管 
你 多 富有 ， 短 时 间 内 马丁 格 尔 战略 可 能 会 奏效 ， 但 最 终 的 惨败 会 让 你 一 无 所 有 。 
这 个 战略 不 止 限于 轮 盘 ， 可 以 用 在 任何 游戏 中 ， 不 管 概率 是 多 少 ， 但 是 除非 游戏 
一 开始 你 就 占 上 风 ， 否 则 不 会 有 效 。 要 是 真有 游戏 你 占 上 风 ， 那 么 还 需要 策略 做 
什么 呢 ? 











7.3 花旗 般 : 究竟 有 多 冒险 ? 


角 子 是 轮 盘 的 矣 品 的 小 伙伴 。 当 买 定 离 手 之 后 ， 轮 盘 一 圈 的 人 都 安静 下 来 ， 
只 听 得 到 球 慢 慢 旋转 的 声音 ， 弹 落 在 球 袋 ， 玩 家 们 几 家 欢喜 几 家 愁 。 花 旗 山 可 完 
全 不 同 ， 整 个 过 程 中 充满 了 尖 叫 声 和 呼喊 声 ， 游 戏 节 奏 非 常 快 。 关 于 花旗 山 的 起 
源 有 很 多 种 版 本 的 传说 ， 似 乎 源 于 一 个 更 加 古老 的 游戏 “hazard”( 这 是 一 个 阿 
拉 但 语 中 的 单词 az- zahbr， 散 子 的 意思 ) ， 这 个 游戏 在 法 国 和 英格兰 非常 盛行 。 那 
么 它 是 怎样 传 到 美国 然后 又 变 形 发 展 的 呢 ? 这 也 有 很 多 种 版 本 。 也 许 因为 我 现在 
住 在 路 易 斯 安 那 的 缘故 ， 我 选择 相信 阿 卡 迪 亚 人 的 故事 。“ 骨 子 ”是 法 国 后 背 用 
语 中 “螃蟹 ”的 意思 ， 也 就 是 最 低级 转 法 的 昵称 。 

花旗 蜗 就 是 掷 两 颗 吉 子 然后 计算 它们 的 总 和 。 这 个 游戏 有 很 多 种 下 注 方式 ， 
和 轮 盘 不 同 的 是 它 的 赌场 优势 不 是 固定 的 ， 在 1.4% ~16.7% 的 区 间 中 浮动 (也 
有 所 谓 的 完全 公平 的 机 会 投注 ， 但 在 下 注 之 前 必须 先 押 下 其 他 的 注 )。 让 我 们 来 























名 ”我们 在 第 6 章 中 提 到 的 著名 的 伯 努 利家 族 中 的 尼古拉斯 和 丹尼尔 兄弟 就 曾经 讨论 过 这 个 游戏 预期 
值 的 无 穷 性 问题 。 它 也 被 称 为 “圣彼得堡 悖 论 ”。 为 了 解决 这 个 问题 丹尼尔 . 伯 努 利 引进 了 “ 效 
用 ”的 概念 ， 这 一 概念 随后 也 称 为 了 经 济 学 的 核心 思想 。 
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关注 一 下 最 流行 的 赌注 方式 一 一 过 关 线 投注 。 这 是 同 额 赌注 ， 就 是 赢 的 和 赌注 一 
样 多 。 要 是 转 到 点 数 的 总 和 是 7 或 者 11， 那么 你 就 赢 了 。 如 果 总 和 是 2，3, 或 
者 12 (花旗 货号 码 ) ， 你 就 输 了 。 其 他 点 数 为 基准 ， 点 数 转 到 重复 时 ， 你 就 局 
了 ， 要 是 转 到 7， 你 就 输 了 。 那 么 赢 的 概率 是 多 少 ? 

现在 你 明白 了 如 何 计算 两 颗 散 子 的 概率 了 吧 。 让 我 们 先 注意 下 初 挪 。 在 36 
中 可 能 的 组 合 中 ， 六 种 情况 (1-6，2-5，…，6-1) 能 得 出 点 数 7， 两 种 情况 
(5-6 和 6-5) 可 以 得 出 点 数 11， 这 样 在 初 括 中 就 有 8/36 即 22% 的 胜率 。 只 有 四 
种 组 合 方式 (1-1，1-2，2-1，6-6) 在 第 一 轮 中 会 输 ， 失 败 的 概率 只 有 4/36 即 
11% 。 剩 下 的 67% 对 应 的 是 这 两 种 情况 都 不 会 发 生 的 概率 ， 此 时 输赢 就 取决 于 你 
的 点 数 。 比 如 说 ， 第 一 轮 播 出 了 一 个 3 和 一 个 5， 那 么 就 得 到 点 数 8。 接 下 来 一 
直 转 下 去 ， 直 到 出 现 点 数 8 或 者 点 数 7 为 止 。 那 么 点 数 8 先 出 现 的 概率 是 多 少 
呢 ? 得 到 点 数 7 有 6 种 组 合 ， 得 到 点 数 8 有 5 种 组 合 。 在 这 11 种 出 现 点 数 7 或 者 
8 的 情况 中 有 5 种 情况 是 你 会 赢 ， 而 有 6 种 情况 是 你 会 输 。 因 此 ， 如 果 点 数 是 8， 
那么 胜率 是 5/11, 或 者 说 是 45% 。 和 点 数 6 一样， 点 数 8 算是 个 好 数字 ， 接 下 
来 的 是 点 数 5 或 者 9， 最 不 好 的 数字 是 4 或 者 10。 要 是 你 实在 不 幸 摇 到 4。 那 么 
你 必须 在 7 出 现 之 前 再 摇 到 4 的 话 ， 那 么 只 有 三 种 组 合 (1-3，2-2,，3-1) ， 可 是 
摇 到 点 数 7 的 组 合 有 6 种 ,那么 赢 的 概率 就 是 3/9， 也 就 是 大 约 33% 。 要 是 是 5 
或 者 9 的 话 ， 那 么 赢 的 概率 是 40% 。 

要 不 是 赌场 中 还 在 一 直 玩 花旗 山 游 戏 的 话 ， 我 们 很 难 一 下 子 就 知道 这 种 游戏 
对 我 们 是 不 利 的 。 只 有 22% 的 赌局 中 你 可 以 直接 获胜 ， 这 是 直接 输 掉 的 概率 的 
两 倍 。 在 剩 下 67% 的 情况 中 ， 你 最 差 也 有 33% 的 概率 获胜 。 其 实 你 一 般 能 做 得 
比 这 好 ， 因 为 好 点 数 出 现 的 概率 远 远 大 于 差 数 字 。 在 计算 胜率 的 过 程 中 我 们 可 以 
利用 全 概率 法 则 来 计算 四 种 不 同 获胜 情况 的 概率 。 表 7-1 将 这 四 种 情况 的 概率 都 
列 出 来 了 。 这 些 概 率 都 以 分 数 形式 出 现 ， 这 样 你 就 可 以 直观 地 看 出 自己 计算 的 结 
果 是 否 正 确 。 





表 7-1 花旗 般 中 初 搓 的 情况 及 其 对 应 的 概率 








初 掷 7 或 11 6 或 8 5 或 9 4 或 10 2, 3, 或 12 
出 现 概率 8/36 10/36 8/36 6/36 4/36 
P( 胜 ) 1 5/11 4/10 3/9 0 
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最 终 ， 把 每 种 情况 出 现 概 率 和 胜率 相 乘 ， 可 以 得 出 
8/36 +10/36 x5/11 +8/36 x4/10 +6/36 x3/9~0. 493 

整体 来 说 ， 获 胜 的 概率 大 约 是 49.3% 。 哇 ， 几 乎 接近 50% 了 ! 也 许 哪里 有 错 ， 
这 游戏 真 的 是 公平 的 ? 不 是 这 样 的 ， 确 切 地 说 ， 仔 细 计 算 之 后 不 难 发 现 胜率 是 
244/495， 也 就 是 0. 492929… 即 使 花头 骨 游 戏 对 玩家 也 是 不 利 的 。 如 果 每 局 下 注 
1 美元 ， 玩 1000 局 ， 那 么 平均 赢 493 次 可 以 赚 到 986 美元 ， 赌 场 优势 就 只 
1.4%。 但 是 ， 由 于 这 个 游戏 进行 的 速度 非常 快 ， 比 起 你 在 玩 轮 盘 (赌场 优势 为 
5% ) 的 朋友 ， 你 可 能 输 得 也 更 快 。 

比 起 过 关 线 投注 更 复杂 的 是 完全 相反 的 没有 过 关 线 投注 。 要 是 第 一 次 就 摇 
出 来 点 数 7 或 者 点 数 11 的 话 你 就 输 了 ， 和 若是 点 数 2 或 者 点 数 3 的 话 就 赢 了 ， 
要 是 游戏 继续 ， 是 7 就 赢 了 。 最 主要 的 是 ， 你 在 买 庄家 赢 ， 这 听 起 来 好 得 太 不 
真实 了 。 这 确实 是 这 样 的 。 注 意 以 上 的 数字 少 了 12 ， 这 就 是 关键 。 虽 然 在 过 关 
线 注 中 ， 点 数 12 是 庄家 赢 ， 但 是 在 不 过 关 线 注 中 ， 你 没 赢 。 第 一 局 中 总 数 12 
是 平局 ， 你 钱 没 多 没 少 。 这 个 警告 也 许 听 起 来 不 重要 ， 但 是 正 是 这 里 违反 了 大 
数 定 律 。 在 这 种 情况 下 ， 庄 家 优势 不 再 是 1.4% ， 而 是 1.37% 。 谁 告诉 过 你 
人 生 是 公平 的 ? 骨 子 这 种 游戏 很 好 地 告诉 了 我 们 ， 人 们 还 是 可 以 发 明 这 样 一 
种 游戏 ， 让 庄家 仅 有 很 小 的 优势 ， 但 是 依据 大 数 定 律 又 足以 让 赌场 每 天 都 
赚钱 。 

我 提 到 过 不 是 所 有 山子 游戏 的 注 都 一 样 无 利 。 最 差 的 是 7。 理 由 很 简单 :你 
只 是 把 注 下 到 了 出 现 7， 和 第 一 轮 出 现 7 的 情况 上 上。 花费 是 四 比 一 ， 因 为 得 到 7 
的 概率 是 6/36， 也 就 是 1/6， 预 期 收益 是 : 4 x1/6 +(-1) x5/6 = -1/62 - 
0. 167， 这 样 庄家 优势 就 是 16.7% ! 玩 这 个 的 唯一 理由 就 是 要 是 7 长 时 间 没 出 现 ， 
但 是 总 是 会 出 现 的 。 不 对 ， 等 一 下 ， 这 听 起 来 不 对 。 你 必须 等 到 7 出 现 非常 频繁 
的 时 候 。 






































7.4 21 点; 靠 记 忆 挣 钱 


关于 21 点 的 起 源 ， 众 说 纷 丝 ， 它 跟 轮 盘 、 花 旗 骨 一 样 没有 确切 起 源 。 它 在 
赌场 中 出 现 的 时 间 比 这 两 者 稍 晚 一 些 ， 大 概 是 在 19 世纪 早期 的 时 候 。 但 在 很 久 
之 前 一 种 名 为 “21 点 ”的 私人 纸牌 游戏 早已 广 为 流 传 。 它 的 基本 规则 非常 简单 。 
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发 牌 者 一 张 接 一 张 地 给 你 发 牌 ， 你 需要 将 每 张 牌 的 数值 相 加 计算 总 和 。 其 中 下 
Q、 开 都 是 被 当成 10 (之 后 所 提 到 的 10 指 的 都 是 包含 以 上 的 J Q、K)，A 为 1 
或 者 11。 发 牌 者 会 在 最 后 给 自己 发 牌 ， 而 你 的 目标 就 只 是 打败 他 。 但 是 如 果 你 
的 总 点 数 超过 21 点 就 会 爆 点 ， 输 掉 你 的 赌注 。 这 意味 着 在 拿 到 每 张 牌 之 后 你 必 
须 决定 是 继续 拿 牌 还 是 停止 。 因 此 ，21 点 和 其 他 赌场 游戏 有 个 根本 性 区 别 : 你 
的 选择 会 影响 比赛 的 胜率 。 当 你 决定 停止 的 时 候 ， 庄 家 开始 拿 牌 直到 总 点 数 达 到 
17 之 后 他 就 停止 拿 牌 。 你 们 的 点 数 进行 对 比 ， 高 者 获胜 〈 包 括 台 面 上 你 的 钱 ) 。 
如 果 点 数 一 样 ， 那 么 是 个 平局 ， 赌 注 不 变 。 如 果 庄 家 点 数 爆 掉 了 ， 那 么 你 就 获 
胜 。 有 一 种 例外 的 情况 : 你 前 两 张 牌 分 别 是 A 和 10， 那 么 你 就 拿 到 了 “ 黑 杰 
殉 ”， 立 马 可 以 拿 到 赌注 的 1.5 倍 。 而 如 果 庄 家 也 拿 到 了 “ 黑 杰 克 ”， 他 立马 得 
到 你 所 下 的 赌注 。 如 果 你 们 都 拿 到 “ 黑 杰 元 ”， 那 么 就 是 平局 了 。 还 有 一 些 特别 
的 规则 ， 比 如 当 你 在 拿 到 前 两 张 牌 之 后 认为 牌 局 对 和 目 己 有 利 ， 你 可 以 选择 “ 双 倍 
下 注 ”; 又 比如 当 你 认为 时 机 恰当 时 可 以 选择 “分 牌 ”， 将 两 张 牌 分 为 两 副 单独 
的 牌 。 

这 游戏 看 起 来 很 公平 ， 谁 点 数 最 高 谁 就 局 ， 如 有 果 点 数 相同 就 没 输 没 遍 。 事 
实 上 它 看 起 来 也 许 对 你 有 利 ， 因 为 你 能 自主 选择 战略 而 庄家 却 没 有 选择 权利 。 
此 外 你 还 赢 的 会 比 庄家 多 ， 因 为 只 要 你 愿意 你 还 可 以 选择 使 用 “ 双 倍 下 注 ” 和 
“分 牌 ”的 策略 。 那 么 这 个 游戏 的 陷阱 在 哪 呢 ? 不 公平 的 地 方 在 点 数 爆 时 ， 你 
会 立马 失去 了 所 有 的 赌注 ; 而 此 时 庄家 根本 不 需要 拿 牌 。 庄 家 利用 这 个 不 公平 
的 地 方 得 到 了 补偿 。 但 21 点 依然 是 所 有 赌场 游戏 中 相对 来 说 最 公平 的 游戏 了 。 
如 果 你 像 和 达 斯 洒 ' 霍 夫 曼 在 电影 《十 人 》 中 饰演 的 雨 人 一 样 可 以 记 住 牌 ， 那 
么 你 就 能 扭转 整个 局 势 。 事 实 上 ， 你 不 需要 有 那么 准确 的 记忆 ， 有 一 些 记 有 牌 絮 
可 以 通过 高 点 增加 低 点 减少 中 间 点 数 不 变 来 帮助 你 记录 整体 分 数 ， 你 只 需要 根 
据 整 体 分 数 调整 策略 和 赌注 大 小 。 当 然 ， 这 需要 大 量 的 练习 才能 做 到 ， 而 这 一 
优势 依然 非常 的 小 ， 最 多 只 有 2% 。 想 一 想 十 人 和 他 兄弟 查理 的 遭遇 ; 赌场 可 
不 喜欢 玩 牌 高 手 。 他 们 也 不 会 让 威廉 梅 西 这 样 的 人 站 在 赌 桌 旁 边 ， 情 形 不 对 
时 就 会 把 你 捞 出 去 。 

在 21 点 中 涉及 的 概率 计算 比 轮 盘 和 花旗 骨 的 概率 计算 要 复杂 很 多 。 随 着 
赌局 的 进行 ， 牌 堆 中 的 牌 对 应 的 比例 也 在 不 断 变 化 。 比 如 游戏 发 的 牌 是 一 副 
牌 ， 已 经 出 现 过 三 个 A， 那 么 你 就 知道 剩 下 的 牌 堆 中 只 有 一 个 A。 为 了 避免 由 
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此 带 来 的 玩家 优势 ，21 点 游戏 通常 以 至 少 六 副 牌 为 一 轮 。 在 六 副 牌 发 完 之 后 
会 仔细 洗 过 牌 再 开始 新 的 游戏 。 为 了 方便 计算 我 们 假设 牌 堆 中 各 种 花色 类 型 的 
牌 比例 保持 不 变 ， 即 从 2 到 A 每 张 牌 都 是 等 可 能 出 现 的 。10 到 的 牌 被 记 为 
10 ,那么 有 4/13 或 者 319 的 概率 得 到 一 个 10，1/13 或 者 7.7% 的 概率 得 到 其 
他 任何 数字 ,1 ~9 和 11 (你 可 以 选择 把 A 记 为 1 或 者 11， 你 可 以 自己 选择 ) 。 
你 赢 的 概率 当然 也 取决 于 你 的 玩法 。 设 想 一 下 你 和 庄家 一 样 的 战略 : 点 数 为 16 
及 以 下 时 继续 拿 牌 ，17 及 以 上 人 停牌。 那么， 可 能 出 现 的 结果 是 17、18 、19、 
20 、21、“ 黑 杰克 ”和 爆 点 。21 是 意味 着 结果 是 21 但 并 不 是 “ 黑 杰 克 ” 的 形 
式 ， 比 如 说 7-8-6 的 组 合 。 每 一 个 点 数 对 应 的 概率 见 表 7-2。 它 们 被 四 售 五 
人 到 最 近 的 整数 值 ， 出 现 17 点 的 概率 比 18 稍 大 ， 出 现 “ 黑 杰克 ”的 概率 略 
低 于 5% 。 











表 7-2 遵循 庄家 策略 可 能 出 现 的 结果 及 对 应 的 概率 








概 率 15% 15% 14% 18% 5% 5% 28% 


如 果 你 和 庄家 都 遵循 庄家 策略 ， 你 下 注 10 美元 之 后 会 发 生 什么 事情 呢 ? 我 
们 先 不 管 “ 分 牌 ”"、“ 双 倍 下 注 ” 等 这 些 特殊 的 规则 ， 只 保留 “ 黑 杰 克 ”。 此 时 你 
就 有 一 个 优势 和 一 个 劣势 。 你 的 优势 在 于 当 你 得 到 了 “ 黑 杰 死 ”而 庄家 没有 时 ， 
你 可 以 得 到 15 美元 。 你 拿 到 “ 黑 杰 克 ” 的 概率 是 5% ， 庄 家 没有 拿 到 的 概率 为 
95% ， 因 此 你 通过 “ 黑 杰 克 ” 赢 15 美元 的 概率 是 0.05 x 0.95 = 0.048， 即 
4.8% 。 每 20 次 游戏 你 这 样 赢 的 概率 不 足 一 次 。 你 的 劣势 就 在 于 当 你 爆 点 时 ， 庄 
家 不 用 玩 也 能 赢 的 概率 ， 此 时 概率 为 28% ， 即 每 四 次 游戏 就 会 出 现 不 止 一 次 。 
如 果 你 既 没 有 爆 点 也 没有 拿 到 “ 黑 杰 克 ”， 那 么 你 的 输 启 取决 于 你 的 结果 。 比 如 
说 ， 如 果 你 有 17 点 ,除非 庄家 爆 点 ， 你 才 可 能 启 。 而 庄家 爆 点 的 概率 是 28% 。 
如 果 庄 家 没 爆 ， 你 也 不 一 定 输 : 如 果 庄 家 也 是 17 点 ， 那 么 这 样 就 是 平局 ， 这 样 
的 概率 是 15% 。 如 果 庄 家 拿 到 18 ~ 21 之 间 的 数字 或 者 是 “ 黑 杰 克 ”， 那 么 你 就 
输 了 ， 这样 的 概率 是 57% 。 如 果 你 的 点 数 是 18 ， 而 庄家 爆 点 或 者 点 数 是 17， 那 
么 你 就 赢 了 ， 这 样 的 概率 是 43% ,平局 的 概率 是 15% ， 输 的 概率 是 42% 。 你 可 
能 的 输赢 模式 以 及 概率 见 表 7-3 所 示 。 
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表 7-3 不 同 结 果 对 应 的 输赢 的 概率 














结 果 17 18 19 20 21 黑 杰克 爆 点 
P( 启 ) 28% 43% 58% 72% 90% 95% 0 
P( 输 ) 57% 42% 28% 10% 5% 0 100% 
P( 平 ) 15% 15% 14% 18% 5% 5% 0 























值得 注意 的 是 图 中 的 数字 是 基于 你 得 到 的 点 数 对 应 的 条 件 概率 。 如 果 需 要 计 
算出 每 一 轮 对 应 的 输赢 概率 需要 运用 全 概率 法 则 ， 将 每 个 条 件 下 的 概率 和 对 应 的 
概率 相 乘 得 到 的 结果 相 加 ， 得 到 最 终 的 全 概率 。 比 计算 输赢 更 有 趣 的 是 你 的 预期 
收入 。 因 为 你 的 实际 收益 可 以 是 - 10 美元 、10 美元 、 或 者 15 美元 ， 我 们 需要 算 
出 这 些 值 对 应 的 概率 ， 然 后 再 计算 出 期 望 值 。 输 掉 10 美元 的 概率 可 以 通过 以 上 
两 个 表 进 行 运算 ， 即 

0. 15 x0.57 +0.15 x0.42 +0.14 x0.28 +0.18 x0.10 

+0.05 x0.05 +0.28 x1~0.49 
其 中 值 等 于 0 的 项 没有 列 出 。 输 掉 的 概率 是 49% ， 这 说 明 输 的 可 能 性 比 不 输 的 可 
能 性 小 ， 但 是 平局 中 你 是 不 会 赢 钱 的 。 事 实 上， 平局 的 概率 大 约 是 10% ， 所 以 
你 输 的 概率 还 是 比 赢 的 大 。 到 现在 可 知 ， 赢 得 15 美元 的 概率 稍稍 低 于 百 分 之 五 ， 
同样 的 计算 方法 可 以 计算 得 出 ， 赢 得 十 美元 的 概率 大 约 是 36% 。 为 了 看 起 来 更 
方便 ， 我 将 这 些 数字 四 售 五 人 取 整 ， 而 计算 期 望 启 率 的 时 候 ， 我 使 用 了 小 数位 来 
保证 期 望 值 -0. 53 的 精确 性 ， 即 每 下 注 10 美元 会 有 53 美 分 的 预计 损失 ，5. 3% 
的 庄家 优势 。 这 和 轮 盘 差不多 ， 但 是 要 记 住 这 有 一 个 前 提 ， 那 就 是 使 用 庄家 的 策 
略 ， 而 且 这 也 是 你 能 做 到 最 好 的 情况 。 现 在 再 来 仔细 看 看 手头 上 的 信息 以 及 怎样 
使 用 。 

赌局 开始 时 ， 庄 家 会 发 给 你 (还 有 所 有 其 他 的 玩家 ) 两 张 正 面 朝 上 的 牌 ， 
庄家 自己 的 两 张 牌 一 张 正 面 朝 上 和 一 张 朝 下 。 你 第 一 个 要 面 对 的 问题 为 是 否 继续 
拿 牌 。 你 面临 的 第 一 个 决定 是 基于 你 两 张 牌 和 庄家 那 张 正面 朝 上 的 牌 做 出 的 。 如 
果 你 的 两 张 牌 的 点 数 最 多 只 有 11 点 ， 你 毫 不 犹豫 地 要 牌 ; 只 要 不 可 能 爆 点 ， 那 
就 继续 要 牌 。 当 你 的 点 数 在 12 点 之 上 ， 问 题 就 来 了 。 假 设 现在 点 数 为 16， 如 果 
继续 要 牌 ， 当 下 一 张 牌 在 6 和 下 之 间 时 点 数 就 爆 了 。 此 时 爆 点 的 概率 是 8/13， 
大 约 是 62% (A 记 为 1， 而 不 是 11)。 要 冒 这 个 险 吗 ? 这 要 看 庄家 的 牌 。 要 是 庄 
家 是 牌 是 6。 这 对 庄家 来 说 可 不 是 什么 好 牌 。 因 为 很 多 情况 下 他 的 点 数 都 会 爆 
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掉 。 所 以 当 你 在 16 点 的 时 候选 择 停止 时 ， 你 赢 的 概率 是 42% 。 如 果 你 决定 继续 
要 牌 ， 考 虑 到 爆 点 的 情况 你 赢 的 概率 就 不 足 38% ， 而 假设 你 继续 要 的 牌 没 有 让 
你 爆 点 ， 依 然 还 是 有 很 多 种 输 的 情形 。 结 论 就 是 ， 当 你 的 点 数 为 16， 而 庄家 点 
数 是 6 时 ， 则 停止 要 牌 。 

按照 上 述 的 考虑 方式 ， 在 经 过 大 量 的 计算 和 计算 机 模拟 之 后 发 现 对 于 我 们 这 
些 不 是 “十 人 ”的 普通 人 来 说 有 一 个 最 佳 的 “基本 策略 ” 。 简 而 言 之 ， 如 果 庄 家 
的 牌 是 2 ~6 之 间 的 点 数 ， 只 要 你 有 爆 掉 的 可 能 性 就 立马 停止 要 牌 ( 即 12 点 以 上 
就 不 继续 要 牌 ) ， 要 是 庄家 的 点 数 在 7 及 其 以 上 ， 你 应 继续 要 牌 ， 直 到 点 数 在 17 
及 以 上 (除非 你 的 点 数 是 12， 庄 家 只 有 2 或 者 3 点 ， 在 这 种 情况 下 你 必须 继续 要 
牌 ) 。 对 庄家 来 说 ， 拿 到 的 第 一 张 牌 的 点 数 在 6 甚至 更 低 是 不 利 的 ， 而 如 果 是 7 
及 以 上 则 是 有 利 的 。 你 必须 根据 具体 的 情况 来 调整 冒险 的 策略 。 相 对 于 庄家 策 
略 ， 这 个 策略 有 一 个 显著 的 作用 就 是 降低 了 爆 点 的 概率 ， 爆 点 的 概率 从 28% 下 
降 到 17% 。 对 于 外 行人 来 说 ， 在 12 点 时 就 停止 要 牌 似乎 比较 奇怪 ， 但 在 庄家 拿 
到 不 好 的 牌 时 这 样 做 是 完全 正确 的 。 要 知道 12 并 不 比 13、14、15 甚至 16 差 ， 
因为 庄家 必须 一 直 跟 牌 直到 17， 这 样 的 话 ， 他 如 果 不 能 战胜 16， 则 也 没 办 法 战 
胜 12。 

但 有 时 这 个 最 基本 策略 也 会 让 你 倍 感 压 力 。 假 设 庄 家 的 牌 是 7， 你 刚刚 通过 
2-5-2-3-4 的 牌 面 拿 到 了 16 点 ， 此 时 是 否 再 要 一 张 牌 变 得 非常 关键 。 你 需要 有 钢 
铁 般 的 意志 才能 冷静 下 来 继续 再 要 一 张 牌 。 你 赢 的 概率 并 不 大 ， 但 是 如 果 你 输 了 
至 少 说 明 你 是 遵循 了 最 佳 策 略 。 不 管 你 邻 座 的 玩家 是 在 15 点 时 停止 要 牌 并 怎样 
吹 咕 ， 你 还 是 能 打败 他 ， 笑 到 最 后 的 。 哎 ， 你 还 是 无 法 赢 过 庄家 : 基本 策略 之 下 
庄家 优势 低 于 0.5% ， 但 这 始终 也 还 是 优势 。 

这 个 基本 战略 也 告诉 了 我 们 什么 时 候 该 双 倍加 注 ， 即 在 拿 到 自己 的 头 两 张 牌 
之 后 加 倍 下 注 。 比 如 ， 你 前 两 张 牌 加 到 了 11， 此 时 你 处 于 非常 有 利 的 地 位 。 你 
有 31% 的 机 会 得 到 21， 这 样 庄家 最 多 只 能 平局 ， 你 得 到 其 他 不 错 的 点 数 比如 说 
19 或 者 20 的 机 会 也 很 大 。 特 别 是 ， 当 庄家 拿 到 不 太 好 的 牌 ， 比 如 说 6， 你 赢 的 
机 会 很 大 。 那 么 这 时 你 就 该 双 倍 加 注 。 加 注 后 ， 你 只 能 得 到 一 张 牌 ， 你 最 不 想 拿 
到 和 A， 这 种 情况 在 赌局 中 非常 少见 。 最 好 的 状况 是 你 11 对 庄家 6， 这 种 情况 下 你 
的 预期 收入 是 36% 。 这 个 基本 战略 告诉 我 们 ， 除 非 庄家 拿 到 了 A， 当 你 有 11 的 
时 候 一 定 要 加 注 ， 其 他 数字 根据 庄家 数字 做 决定 。 基 本 策略 告诉 我 们 最 不 利 的 双 
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倍加 注 的 情况 是 你 拿 到 A 和 2 (也 叫做 “ 软 13”， 它 可 以 被 视 为 3 点 或 13 点 ) ， 
而 庄家 拿 到 5。 这 样 你 的 预期 收入 只 有 0. 003% 即 每 1000 美元 赢 3 分 。 不 是 很 
多 , 但 至 少 还 是 有 收益 的 ， 在 赌场 中 获得 收益 的 情况 能 有 和 多少 呢 ? 

最 后 ， 基 本 策略 为 何 时 分 牌 也 做 出 了 指导 。 如 果 你 开始 两 张 牌 是 一 对 ， 你 有 
权 加 另外 一 个 注 然后 把 牌 分 开 来 。 然 后 你 就 依次 玩 这 两 组 牌 。 当 这 两 张 牌 是 两 个 
8 时 你 必须 选择 分 牌 。 首 先 ，16 不 是 一 个 好 数字 ， 而 单个 的 点 数 8 作为 开始 还 是 
很 不 错 的 。 如 果 你 拿 到 的 是 两 个 6， 单 个 6 可 不 是 一 个 好 数字 ， 此 时 只 有 当 庄 家 
拿 到 了 坏 牌 时 你 才 可 以 选择 分 牌 。 拿 到 两 个 A 时 也 应 该 选择 分 牌 ， 但 如 果 拿 到 两 
个 10 就 不 要 分 牌 了 。 这 些 都 很 容易 明白 ， 但 是 很 多 分 牌 的 情形 却 不 是 那么 显 而 
易 见 的 。 比 如 说 ， 当 你 拿 到 了 两 张 4， 而 庄家 拿 到 的 是 5 或 者 6 时 你 才 要 选择 分 
牌 ， 否则 就 不 要 分 牌 。 要 是 一 直 赌 下 去 ， 连 德 米尔 也 没 法 计算 清楚 了 。 

还 有 一 些 更 为 复杂 的 规则 和 特例 ， 各 种 赌场 的 规则 也 不 尽 相 同 。 但 21 点 是 
“相对 公平 ”的 赌场 游戏 ， 然 后 根据 这 个 基本 策略 ， 你 在 赢 的 时 候 会 觉得 自己 非 
常 聪明 ， 在 输 的 时 候 只 会 觉得 非常 不 幸 喷 了 。 
































7.5 探寻 最 优 的 策略 


我 遇 到 了 因为 预期 收入 是 负数 而 不 愿意 在 轮 盘 上 人 花 一 分 钱 的 概率 学 家 。 我 
觉得 这 还 是 有 点 可 笑 。 不 是 因为 他 们 不 赌博 ， 这 完全 是 个 人 的 选择 ,我 自己 也 
不 经 常 赌博 〈 我 的 住处 离 赌场 很 近 ， 开 车 只 需要 几 分 钟 ， 但 是 我 从 来 没有 去 
过 ) 。 我 明白 会 有 些 人 认为 赌博 是 一 种 最 为 愚蠢 的 花 钱 方式 ， 这 种 想法 很 正常 。 
我 觉得 可 笑 的 是 他 们 的 理由 一 一 期 望 值 为 负数 。 毕 竞 ， 我 们 都 很 明白 的 ， 不 是 
吗 ? 人 们 买 彩票 玩 转 盘 ， 娱 乐 消 遗 ， 不 是 为 了 以 此 谋生 而 只 是 为 了 抓 住 启 的 机 
会 。 如 果 我 们 一 直 依 靠 着 期 望 值 而 活 ， 那 我 们 大 可 不 必 买 保险 了 ， 因 为 这 就 是 
预期 损失 。 我 时 不 时 玩 上 一 把 ， 是 因为 这 其 中 展现 了 其 他 活动 给 予 不 了 的 东 
西 ， 我 能 有 机 会 看 着 随机 性 和 大 数 定律 在 现实 中 的 运用 。 好 吧 ， 我 承认 启 的 确 
比 输 更 让 我 开心 。 在 这 部 分 ， 我 们 先 设想 ， 大 数 定律 没有 打消 我 们 进 赌场 的 念 
头 。 当 我 们 身 处 赌场 之 中 ,我 们 要 充分 运用 自己 的 聪明 才智 来 玩 几 把 。 如 果 你 
还 是 觉得 道德 上 过 不 去 ,一 些 网 上 的 游戏 可 以 让 你 不 花 一 分 钱 过 一 把 赌 疗 。 下 
面 让 我 们 来 大 显 身手 吧 。 
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试想 以 下 场景 。 你 急需 花 200 美元 买 夜 间 去 洛杉矶 的 航班 机 票 ， 但 是 你 现在 
只 有 100 美元 。 而 你 的 旅馆 旁 有 家 赌场 ， 于 是 你 打算 拿 着 这 100 美元 去 冒险 ， 希 
望 能 翻 一 番 。 你 知道 胜率 对 你 来 说 是 不 利 的， 但 是 买 不 了 机 票 的 话 ， 这 100 美元 
也 对 你 毫 无 用 处 。 那 么 你 该 如 何 下 注 呢 ? 你 应 该 孤注一掷 ， 把 100 美元 下 注 到 同 
额 赔 率 的 游戏 上 ， 这 样 你 就 有 18/38， 大 约 0. 47 的 概率 能 让 你 立刻 得 到 两 倍 的 
钱 ， 直 接 去 机 场 搭乘 飞机 。 如 果 你 小 心 谨 慎 ， 也 许 你 就 只 想 下 注 一 半 的 钱 ， 即 使 
输 了 还 能 继续 玩 下 去 。 如 果 你 连 下 两 次 50 美元 ， 那 么 在 全 输 光 之 前 有 多 少 概率 
能 赢 到 200 美元 呢 ? 两 轮 之 后 成 功 的 概率 是 0.47? ~0.22， 两 轮 之 后 全 输 光 的 概 
率 是 0.53*~0.28， 剩 下 还 有 大 约 0.5 的 概率 〈 实 际 是 低 于 0.5) 是 一 输 一 赢 之 
后 回 到 了 最 初 的 情况 。 哈 哈 ， 这 种 情形 你 知道 应 当 用 递归 方法 来 计算 未 知 的 概率 
了 吧 。 这 种 看 似 更 为 小 心 的 办 法 成 功 的 概率 大 约 是 0.45。 全 部 押 上 赢 的 概率 是 
47% ， 而 每 次 押 50 美元 赢 的 概率 只 有 45% 。 而 如 果 你 每 次 押 的 注 越 小 ， 情 况 就 
会 越 糟糕 。 有 句 话 叫 放手 一 搏 : 全 押 上 之 后 就 祈祷 好 运 吧 。 这 背后 的 想法 是 ， 既 
然 赌 局 本 来 就 于 你 不 利 ， 那 么 不 利 的 次 数 越 少 对 你 越 有 利 。 庄 家 是 靠 长 期 运营 3 
赢利 ， 所 以 你 玩 的 次 数 越 多 ， 你 的 情况 就 越 糟糕 。( 就 像 1974 年 乔治 : 福 尔 曼 在 
扎 伊 尔 将 重量 级 拳击 冠军 的 头衔 输 给 穆罕默德 阿里 ; 他 不 断 重 击 阿里 的 手臂 和 
肩膀 最 终 自 己 精疲力竭 ， 最 终 在 第 八 轮 时 轻易 就 被 击 倒 ) 。 在 这 种 不 利 的 环境 下 
最 糟糕 的 办 法 就 是 胆 小 如 和 鼠 ， 就 是 每 次 都 下 最 小 额 的 注 。 如 果 采 取 这 种 策略 ， 今 
夜 你 是 无 法 坐 上 飞 往 洛 杉 矶 的 航班 的 。 

上 述 情形 也 是 一 种 随机 游 走 的 状况 ， 跟 第 6 章 中 提 到 汤姆 和 哈 利 的 抛 硬币 游 
戏 类 似 。 你 有 100 美元 的 本 金 ， 每 次 重复 下 同等 金额 的 赌注 ， 直 到 全 部 输 光 或 者 
翻 一 番 (假设 每 次 的 赌注 都 是 等 额 的 以 便 最 终 可 以 整整 得 到 200 美元 ， 因 为 多 余 
的 钱 对 你 来 说 没什么 意义 )。 我 们 先 从 整体 上 来 看 这 个 问题 。 假 设 初始 资本 为 a 
美元 ， 目 标 为 美元， 达到 目标 后 就 停 手 。 当 然 在 之 前 全 输 光 的 话 肯 定 无 法 达到 
目标 。 你 在 没有 全 输 光 或 者 达到 b 美元 的 目标 之 前 不 能 停止 。 假 设 你 每 次 都 赌 上 
1 美元 ， 这 样 的 话 初 始 资 本 是 多 少 都 可 以 ， 因 为 这 样 你 可 以 直接 用 “每 单位 赌 
注 ” 来 代替 “美元 ”。 比 如 说 你 的 初始 资本 为 100 美元 ， 目 标 是 300 美元 ， 每 次 
押 50 美 元， 所 以 你 的 单位 赌注 为 50， 初始 资本 为 2 个 单位 ， 你 离 目标 还 差 4 个 
单位 ， 离 破产 还 差 两 个 单位 。 这 样 你 获胜 的 概率 和 一 美元 游戏 是 一 样 的， 这 时 ， 
a =2, =6。 第 一 轮 赢 的 概率 为 p，9 表示 输 的 概率 ， 那么 g =1 -p。 在 公平 的 游 
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戏 当 中 , pP =g =0.5， 在 不 公平 的 游戏 当中 p <g。 那 么 你 达到 目标 的 成 功 概率 是 
多 少 呢 ? 

公平 赌局 更 好 计算 : 如 果 你 开始 有 a 单位 的 本 金 ， 每 轮 结束 后 的 预期 收益 都 
是 a 单位 。 你 的 实际 收益 起 伏 不 定 ， 但 因为 这 是 公平 的 赌局 ， 所 以 平均 来 说 你 的 
财产 是 不 变 的 。 你 达到 目标 或 破产 时 也 同样 适用 .9 在 这 种 情况 下 ， 你 要 么 有 0 
单位 或 者 4 单位 的 财产 。 那 么 设 p, 是 你 在 破产 前 达到 目标 的 概率 ; 那么 失败 破 
产 的 概率 就 是 1 -p,。 因 为 预期 值 是 a， 那 么 我 们 得 到 以 下 等 式 . 

a=b xp, +0x(1-p,) =0b xp, 
解法 非常 简单 ， 最 终 得 到 在 公平 比赛 中 破产 前 达到 目标 的 概率 
ps,=a/b 

本 金 翻 一 番 对 应 5 =2a， 这 样 成 功 的 概率 就 是 1/2。 因 为 赌局 是 公平 的 ， 所 以 这 
也 说 得 通 。 这 也 说 明了 ， 在 一 个 公平 的 赌局 中 放手 一 捕 没 有 什么 好 处 。 在 以 上 情 
况 下 ， 你 想 把 100 美元 本 金 翻 一 番 ， 在 放手 一 搏 策略 下 ，a =1,， =2。 如 果 你 每 
次 赌 50 美元 , 那么 a =2,， 5 =4， 每 次 赌 10 美元 ， 那 么 a =10, 5 =20， 以 此 类 
推 。 不 论 你 怎么 玩 ， 你 有 一 半 的 机 会 获胜 。 如 果 你 只 要 一 赢 就 收 手 的 话 ， 那 么 
5 =a+1， 那 么 你 成 功 的 概率 是 a/(a+1)。 

如 果 赌 局 不 公平 的 话 ， 就 有 趣 地 多 也 要 复杂 得 多 。 现 在 p <q， 这 种 随机 游 走 
倾向 于 向 下 ， 所 以 你 的 预期 金额 一 轮 比 一 轮 少 。 经 计算 ,，g/p >1， 

在 不 公平 比赛 中 破产 前 达到 目标 /的 概率 = 证 
当然 这 个 公式 看 起 来 不 是 很 明了 ， 那 么 我 们 来 用 轮 盘 游戏 对 应 的 数字 来 试 一 下 。 
此 时 p=18/38,，g=20/38， 这样 g/p =20/18 =10/9。 现在 ,借助 于 我 之 前 描述 
的 单位 赌注 ， 可 以 在 所 有 不 同 的 战略 中 用 a 和 来 描述 。 比 较 以 下 三 个 战略 : 
放手 一 搏 策略 : a=1 和 64=2 
中 规 中 矩 策略 : a =10 和 4=20 

















@ ”事实 上 这 个 结果 没有 那么 明显 ， 需 要 通过 蒜 〈 第 158 页 的 注脚 1) 的 “可 选 停止 理论 ”才能 得 知 。 
当 你 达到 目标 或 者 破产 时 都 必须 要 停 下 来 ， 这 是 “停止 规则 ”。“ 停 止 规则 ”决定 最 终 期 望 值 是 否 
依然 为 a。 比 如 当 你 破产 时 ， 你 的 期 望 财 产 只 有 0 而 不 是 a。 但 是 在 轮 盘 游戏 中 对 应 的 停止 规则 决 
定 的 期 望 值 就 是 a。 
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胆 小 如 鼠 策略 : a =100 和 b=200 
将 具体 的 数值 代入 上 述 公式 可 以 得 出 各 自 成 功 的 概率 如 下 : 
放手 一 搏 策略 : 47% 
中 规 中 矩 策略 : 26% 
胆 小 如 鼠 策略 : 0. 003% 

如 果 在 领先 的 时 候 ， 你 想 退 出 ， 那 么 胆 小 如 鼠 策 略 的 报复 就 来 了 。 这 样 ， 

b =a +1， 而 在 这 三 种 情况 下 ，a 分 别 等 于 1，10 和 100， 这 样 成 功 的 概率 就 是 : 
放手 一 搏 策略 : 47% 
中 规 中 矩 策略 : 85% 
胆 小 如 鼠 策略 : 90% 

在 放手 一 搏 策略 中 ， 你 要 人 么 全 押 上 ， 要 么 全 不 动 ， 这 样 就 只 有 一 轮 ， 所 以 翻 
一 番 和 领先 是 同一 个 意思 。 其 他 策略 下 ， 即 使 屡 战 屡 败 ， 只 要 还 有 剩 下 的 钱 去 
赌 ， 你 就 有 机 会 逆转 达成 目标 。 要 注意 ， 如 果 你 是 胆 小 如 鼠 派 的 ， 当 你 还 优先 的 
时 候 ， 最 好 马上 离开 赌 桌 。 我 们 既然 明白 庄家 是 无 法 战胜 的 ， 但 我 们 依然 得 出 这 
样 的 结论 ， 不 免 有 些 吃惊 。 关 键 在 于 ， 当 你 领先 的 时 候 ， 你 其 实 只 赚 了 1 美元 ， 
而 你 输 的 时 候 ， 你 是 输 了 100 美元 。 所 以 赌场 优势 是 毫 无 疑问 的 。 

用 这 些 公式 来 比较 公平 的 赌局 和 稍微 不 太公 平 的 赌局 ， 如 花旗 仙 ， 是 件 很 有 
趣 的 事 。 之 前 我 们 得 出 ， 赢 得 跨 线 赌注 的 概率 是 49.3% ， 这 快 接 近 公 平 了 。 有 
100 美元 本 金 ， 每 次 下 注 1 美元 ， 在 破产 前 试 着 把 本 金 翻 一 番 。 在 公平 的 赌局 中 ， 
你 有 50% 的 机 会 成 功 ,但 在 花旗 骨 游 戏 中 ,，p =0.493，a =100， 和 上 =200， 这 
样 成 功 的 概率 只 有 6% 。 但 只 是 在 这 种 成 功 概率 近乎 于 50% 的 游戏 中 。 如 果 你 回 
过 头 看 看 汤姆 和 哈 利 的 公平 游戏 中 的 图 表 ， 你 回想 起 路 径 在 慢 慢 偏离 ， 长 期 看 来 
是 远离 的 ， 但 是 最 终 还 是 回 到 原点 。 不 公平 的 游戏 生成 的 路 径 之 后 在 有 限 的 次 数 
里 回 到 原点 ， 然 后 无 休止 地 在 负数 区 域 ， 最 终 越 来 越 小 。 不 公平 的 游戏 要 多 不 公 
平 就 有 多 不 公平 。 

在 本 章 开 头 ， 我 们 就 是 用 这 个 不 公平 游戏 的 公式 来 为 德 米尔 计算 概率 的 。 首 
先 ， 在 四 次 抛掷 单个 仍 子 的 时 候 ， 他 试图 至 少 抛掷 出 一 个 6; 这 时 游戏 对 他 有 
利 ， 所 以 这 个 公式 适用 于 庄家 。 但 是 当 他 24 次 抛掷 双 般 子 想 要 直到 得 到 两 个 6 
的 时 候 ， 这 个 赌局 对 他 很 不 利 。 如 果 你 自己 对 自己 实验 一 下 ， 记 住 要 保留 p 和 gq 
的 所 有 数位 ， 因 为 四 舍 五 和 的 小 小 误差 会 改变 最 后 的 结果 。 
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让 我 们 重新 回 到 赌场 开始 玩 轮 盘 游 戏 。 现 在 有 一 个 女士 也 要 去 洛杉矶 ， 但 是 
她 只 是 无 聊 去 那里 散 散心 而 且 已 经 买好 票 了 。 和 荷 官 说 赌场 马上 就 要 停止 营业 了 ， 
问 你 想 要 玩 多 少 轮 。 如 果 这 位 女士 决定 每 轮 都 押 上 一 美元 ， 想 要 将 她 领先 的 概率 
最 大 化 ， 那 么 她 应 该 选择 玩 多 少 轮 ?” 这 个 问题 就 变 得 跟 上 面 的 问题 不 一 样 了 。 虽 
然 这 位 女士 可 以 在 她 领先 之 后 就 谨慎 地 退出 ， 但 是 她 却 无 从 得 知 自己 从 第 几 轮 开 
始 可 以 领先 。 实 际 上 她 应 该 要 进行 33 轮 。 为 什么 呢 ? 因为 只 押 一 个 数字 时 下 的 
注 是 35 美元， 所 以 如 果 她 想 要 赢得 话 必须 至 少 玩 35 轮 。 如 果 她 只 赢 了 一 次 ， 她 
输 了 34 美元 获得 35 美元， 她 把 启 的 这 一 美元 继续 下 注 。 此 时 她 有 36 美元 ， 凭 
借 着 这 一 美元 领先 了 。 如 果 她 启 的 次 数 更 多 ， 那 么 优势 就 会 越 明 显 。 除 非 她 的 运 
气 非常 的 背 ， 这 35 轮 游 戏 全 部 都 输 掉 。 而 这 种 全 输 的 概率 为 

P(35 轮 连 输 ) = (37/38)” =0. 39 

因此 在 35 轮 游 戏 结束 之 后 她 有 61% 的 机 会 可 以 领先 。 这 个 结果 可 能 有 些 令 
人 吃惊 ， 她 领先 的 概率 比 落后 的 概率 更 高 ， 这 是 一 个 不 公平 的 游戏 。 那 么 是 哪里 
出 了 问题 呢 ? 其 实 她 依然 还 是 有 预期 损失 的 。 她 每 输 一 轮 就 要 输 掉 35 美元 ; 而 
赢 一 轮 只 能 赢 1 美元 。 这 种 情况 占 所 有 可 能 性 的 77% 。 如 果 她 赢 了 两 轮 ， 她 就 会 
以 37 美元 的 结果 领先 ， 这 种 情况 占 17% 。 启 三 轮 的 情况 有 5% 的 可 能 性 ， 此 时 
她 可 以 凭借 73 美元 的 成 绩 领 先 。 随 着 赢 的 次 数 的 增加 ， 概 率 迅 速 下 降 ， 她 赢 的 
钱 并 不 能 弥补 她 很 有 可 能 损失 的 35 美元 。 虽 然 她 领先 的 概率 更 高 ， 但 是 平均 5% 
的 预期 损失 还 是 会 让 她 遭受 损失 。 这 是 任何 策略 都 无 法 解决 的 问题 。 这 个 典型 的 
例子 也 很 好 地 诠释 了 领先 概率 与 预期 收入 是 完全 不 同 的 两 个 概念 。 

如 果 她 在 35 轮 游戏 之 后 继续 再 玩 一 轮 呢 ?” 那 么 只 启 一 轮 就 不 足以 让 她 保持 
领先 地 位 了 ， 她 甚至 有 可 能 破产 。 玩 36 轮 游戏 时 为 了 领先 她 必须 至 少 赢 两 轮 。 
在 36 轮 游 戏 中 她 一 次 都 没有 赢 的 概率 为 

P(36 轮 都 没 赢 ) = (37/38) 一 0.38 
启 一 轮 的 概率 为 
P(36 轮 中 赢 了 一 轮 ) =36 x1/38 x (37/38 ) 一 0. 37 

因此 要 计算 至 少 赢 了 两 轮 的 概率 只 需要 用 1 减 去 这 两 种 情况 的 概率 ， 得 到 结 
果 为 0.25。 所 以 在 36 轮 游 戏 之 后 她 领先 的 概率 只 有 25% 。 男 一 方面 如 果 她 万 了 
两 次 ， 那么 玩 了 71 轮 之 后 她 也 可 以 保持 领先 (初始 资金 为 71 美元 , 输 了 69 美 
元 ， 启 了 2 x35 美元 =70 美元 ,保持 两 启 的 战绩 ， 最 终 还 有 72 美元 ,保持 1 美 
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元 的 领先 地 位 ) 。 那 么 让 我 们 来 计算 一 下 这 种 情况 的 获胜 概率 。 在 71 轮 游戏 中 她 
一 次 都 没有 赢 的 概率 为 
P(71 轮 都 没 赢 ) = (37/38)” =0. 15 
赢 一 轮 的 概率 为 
P(71 轮 中 赢 了 一 轮 ) =71 x1/38 x (37/38) =0. 29 

所 以 在 这 种 情况 下 至 少 赢 两 轮 的 概率 为 0.56。71 轮 之 后 有 $6% 的 机 会 可 以 
获得 领先 地 位 ， 这 比 35 轮 游戏 后 保持 领先 地 位 的 61% 要 低 一 些 。 你 必须 要 知道 
对 于 她 来 说 最 好 的 策略 就 是 一 直 玩 ， 直 到 “临界 点 ”， 到 达 这 个 点 之 后 她 只 需要 
再 启 一 局 就 可 以 领先 了 。 男 外 一 个 建议 就 是 ， 玩 3 x36 -1 =107 轮 游戏 需要 至 少 
赢 三 次 才 可 以 领先 ， 此 时 赢 三 轮 的 概率 为 54% ， 比 71 轮 的 56% 小 一 点 。 随 着 局 
数 越 来 越 多 ， 概 率 越 来 越 小 。 如 果 她 想 要 领先 平均 每 35 轮 就 要 赢 一 轮 ， 而 她 平 
均 每 38 轮 游戏 才 赢 一 轮 。 明 白 这 一 点 之 后 就 不 难 理解 上 述 的 结论 了 。 玩 的 局 数 
越 多 她 领先 就 越 难 。 因 此 ， 如 果 她 每 次 都 押 一 个 数字 ， 对 于 她 来 说 最 好 的 策略 就 
是 玩 35 轮 游戏 ， 此 时 领先 的 概率 为 61% 。 图 7-1 所 示 为 随 着 游戏 的 进行 她 每 一 
轮 游 戏 之 后 领先 的 概率 。 这 个 锯齿 状 的 线 。” pn 
在 35、71 和 107 等 数值 时 达到 了 波峰 。 最 
高 值 是 在 第 35 轮 时 对 应 的 0.61， 随 后 的 
峰值 越 来 越 小 。 随 着 轮 次 增多 ， 线 条 不 断 04| 
延伸 ， 由 于 无 法 保证 依靠 1/38 的 概率 在 每 
35 轮 中 都 有 一 轮 会 赢 ， 所 以 最 终 的 结果 会 
变 成 0。 0 

那 对 于 其 他 的 玩法 来 说 呢 ? 如 果 她 每 
次 都 在 所 有 偶数 上 下 注 ， 那 么 她 赢 一 次 就 。 图 ”1 每 轮 游 戏 对 应 的 领先 福 率 
可 以 领先 ， 此 时 概率 为 18/38 即 47% ， 这 
显然 要 小 于 61% 。 如 果 她 下 三 个 注 ， 那 么 她 必须 至 少 赢 两 个 ， 对 应 的 概率 为 
46% 。 如 果 是 下 五 个 注 ,， 那么 至 少 要 赢 三 个 ， 对 应 的 概率 为 45% (下 四 个 注 的 
情况 是 最 坏 的 情形 ， 她 必须 也 要 赢 三 个 )。 所 以 她 在 这 个 游戏 中 的 最 佳 策 略 就 是 
只 在 一 个 数字 上 下 注 。 我 想 现在 读者 们 应 该 很 容易 就 理解 任何 其 他 的 玩法 领先 的 
概率 都 在 47% 和 61% 之 间 。 但 我 们 还 是 来 计算 一 下 以 保证 它 的 正确 性 吧 。 假 设 
现在 她 要 押 三 个 数字 组 合 ， 赔 率 是 11:1， 所 以 如 果 她 玩 11 轮 游 戏 只 需要 赢 一 轮 
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就 可 以 保证 领先 〈 和 前 面 得 出 来 的 结论 一 样 ， 这 是 她 的 最 佳 策略 ) 。 每 一 轮 游戏 
中 她 赢 的 概率 是 3/38 。 按 照 惯 例 计算 这 11 轮 游戏 她 都 输 的 概率 ， 然 后 再 用 1 减 
去 这 个 概率 得 到 至 少 赢 一 轮 的 概率 ， 即 P (11 轮 游戏 后 领先 ) =1 - (35/38)" 二 
0. 595， 所 以 她 有 59. 5% 的 机 会 可 以 赢 ， 稍 微 低 于 只 押 一 个 数字 的 概率 。 

最 后 让 我 们 用 一 个 公式 来 总 结 这 一 小 节 。 如 果 她 每 一 轮 游 戏 都 押 n 个 数字 ， 
那么 她 每 一 轮 游戏 输 的 概率 为 1 - n/38， 彩 金 是 36/n -1。 所 以 她 此 时 的 最 佳 策 
略 是 玩 36/n -1 轮 游 戏 ， 如 果 在 这 些 轮 中 至 少 赢 了 一 轮 她 就 可 以 领先 。 这 种 情况 
的 概率 为 











P( 游 戏 结束 之 后 领先 ) =1- (1 -na/38) 5 
你 会 发 现 随 着 的 值 变 大 ， 这 个 公式 的 值 不 断 减 小 。 所 以 概率 的 最 大 值 对 应 的 
的 值 为 1， 也 就 是 每 次 游戏 只 押 一 个 数字 。 


7.6 赢 了 钱 却 输 了 朋友 











在 赌博 中 保持 常 胜 不 败 的 地 位 的 唯一 方法 就 是 当 庄 家 。 你 必须 要 使 一 个 游戏 
听 起 来 非常 的 公平 ,其 至 是 对 你 的 对 手 有 利 的 (当然 实际 上 是 对 你 自己 有 利 
的 ) 。 还 记得 我 们 在 2. 3 节 中 介绍 的 那个 神奇 的 例子 吗 ? 只 需要 23 个 人 就 可 以 保 
证 至 少 两 个 人 在 同一 天 生日 的 概率 高 达 50% 。 当 你 和 你 的 朋友 艾 伯 特 都 在 轮 盘 
上 输 钱 时 ， 你 可 以 利用 这 点 向 艾 伯 特 要 求 附 加 赌注 。 我 不 是 让 你 去 轮 盘 周围 走 一 
圈 问 每 个 人 的 生日 ， 而 是 让 你 建议 艾 伯 特 你 们 两 人 都 下 1 美元 的 注 。 如 果 接 下 来 
八 次 转 轮 中 出 现任 何 重复 数字 你 就 会 说 ， 而 没有 重复 数字 他 就 启 。 他 当然 会 同意 
玩 这 个 游戏 。 因 为 轮 盘 上 有 38 个 数字 ， 而 你 只 选择 转 8 次 ， 每 次 出 现 的 数字 不 
同 的 概率 非常 高 。 但 是 出 乎 艾 伯 特 的 意料 ， 他 将 会 输 。 

就 像 生 日 问题 一 样 ， 我 们 需要 计算 每 个 数字 都 不 一 样 的 事件 对 应 的 概率 ， 然 
后 再 用 1 减 去 这 个 概率 。 参照 生日 问题 的 计算 公式 可 以 知道 


凌空 重 往 ) 1_3/ v306、... 31 
P( 数 字 重 复 ) =1 BR 尖 0.55 


所 以 你 启 的 概率 是 0.55， 预 期 收入 是 10% 。 你 拥有 优势 需要 的 最 少 次 数 是 
8， 最 开始 的 时 候 你 完全 可 以 将 次 数 提高 。 比 如 十 次 ,十 次 转 轮 中 出 现 相同 数字 
的 概率 是 多 少 ? 艾 伯 特 当 然 也 会 同意 打赌 。 此 时 你 赢 的 概率 变 成 了 73% 。 如 果 
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你 将 次 数 提高 到 19 次 ， 即 38 次 的 一 半 ， 你 赢 的 概率 变 成 了 99. 6% 。 可 怜 的 艾 伯 
特 没 有 输 给 赌场 却 输 给 你 了 。 

我 将 会 再 介绍 几 个 貌似 公平 但 实际 对 你 有 利 的 小 游戏 。 第 一 个 游戏 就 是 “ 石 
头 和 剪子 布 ”的 随机 变形 版 。 为 了 防止 你 忘记 这 个 经 典 的 游戏 ， 我 来 提醒 一 下 你 。 
你 和 你 的 对 手 同 时 出 手 ， 可 以 选择 出 石头 〈 握 拳头 ) 、 剪 子 (“V” 的 手势 ) 或 
布 〈 张 开 手 掌 ) 。 游 戏 规定 石头 打败 剪子 ， 剪 子 打败 布 ， 布 打败 石头 。2 如 果 你 
知道 你 的 对 手 出 什么 手势 ， 就 像 《辛普森 一 家 》 中 的 丽水 知道 巴特 每 次 都 会 出 
石头 一 样 (巴特 认为 石头 是 最 坚硬 的 ， 没 有 什么 可 以 打败 它 !) ， 你 毫 无 疑问 也 
会 局。 即使 你 不 是 每 次 都 知道 对 手 会 出 什么 ， 你 也 许 知道 他 大 概 的 路 数 。 说 不 定 
你 的 对 手 是 一 个 偏爱 出 石头 的 人 。 这 时 你 多 出 布 比较 有 利 。 又 或 者 你 的 对 手 非常 
爱 出 布 ， 那 么 你 就 多 出 剪刀 。 你 和 你 的 对 手 每 一 轮 之 前 有 不 同 的 选择 (三 种 情况 
不 同 的 概率 分 布 )， 当 你 知道 了 对 手 的 策略 之 后 可 以 调整 自己 的 策略 ， 这 样 就 可 
以 保证 在 长 期 中 保持 优胜 的 地 位 。 我 们 可 以 用 这 个 逻辑 来 构建 一 个 对 你 有 利 的 
游戏 。 

我 们 可 以 选择 用 三 个 山子 A、B 、C 来 代替 拳头 ， 把 每 一 面 的 数字 用 如 下 的 
方式 标记 : 














3 5 

3, 4, 4, 4 
,2, 2, 6,6 
这 样 可 以 保证 这 些 骨 子 两 两 比较 时 A 可 以 打败 B，B 可 以 打败 C，C 可 以 打败 A。 
我 们 一 眼 就 可 以 看 出 如 果 A 打败 B， 则 A 出 现 的 必然 是 数字 5 那 一 面 ， 对 应 的 概 
率 为 2/3。 同 理 ， 当 C 出 现 的 必然 是 数字 2 时 ，B 可 以 打败 C， 此 时 对 应 的 概率 
也 是 2/3。 最 后 ，C 出 现 数字 是 6 时 ， 它 必然 会 打败 A， 此 时 的 概率 为 1/3; 而 当 
C 出 现 数字 是 2 而 A 出 现 的 数字 是 1 时 ， 它 也 会 会 打败 A， 此 时 的 概率 为 2/3 x 
1/3 =2/9。 把 这 两 个 概率 相 加 可 以 得 到 C 打败 A 的 概率 为 5/9。 因 此 我 们 得 
出 了 : 

P(A 打败 B) =2/3 >1/2 











”这 一 规则 是 最 普遍 的 规则 。 在 《 宋 飞 正 传 》“ 蔡 身 ” 这 一 集中 ， 克 莱 默 和 米奇 玩 这 个 游戏 设 定 的 
规则 是 石头 可 以 打败 任何 手势 ， 所 以 他 们 的 游戏 不 是 很 好 判断 胜 负 。 
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P(CC 打败 C) =2/3 >1/2 

P(C 打败 A) =5/9 > 172 
最 后 一 个 概率 5/9 大 约 等 于 56% ， 因 此 在 这 种 情况 你 的 优势 相 比 于 前 两 种 情况 的 
67% 会 变 得 稍 小 。 这 个 奶子 游戏 和 石头 剪子 布 类 似 的 地 方 就 在 于 它们 都 是 非 传递 
性 的 : 从 长 期 来 看 A 会 打败 B，B 会 打败 C，C 会 打败 A.9 现 在 你 知道 怎么 样 在 
圣诞 大 餐 之 后 从 希 德 板 叔 那里 捞 一 笔 了 吧 。 邀 请 他 玩 般 子 游 戏 ， 每 次 都 有 礼 狐 地 
让 他 先 选 角 子 。 如 果 他 对 此 感到 怀疑 〈 一 段 时 间 之 后 ) ， 你 可 以 先 选 。 他 大 概要 
过 好 一 会 才 会 知道 怎么 样 用 你 的 选择 来 为 自己 谋 利 ， 但 是 你 却 从 一 开始 就 知道 怎 
么 样 利用 这 个 策略 了 。 为 了 让 这 个 游戏 看 起 来 更 公平 ， 你 可 以 将 每 一 颗 蜗 子 上 画 
上 更 多 的 数字 。 

仍 子 游戏 的 一 种 变形 就 是 选举 。 假 设 现在 有 三 个 候选 人 ， 和 暂且 称呼 他 们 为 阿 
尔 ， 乔治 和 拉 尔 夫 。 假 设 1/3 的 选民 对 他 们 的 排序 是 阿尔 ， 乔 治 和 拉 尔 夫 ; 另外 
1/3 的 选民 的 排序 是 乔治 ， 阿 尔 和 拉 尔 夫 ; 剩 下 1/3 的 选民 的 排序 是 拉 尔 夫 ， 阿 
尔 和 乔治 。 此 时 阿尔 就 可 以 说 有 273 的 选民 相对 于 乔治 更 支持 他 ; 而 拉 尔 夫 也 可 
以 宣称 相对 于 阿尔 ，273 的 选民 更 支持 他 。 但 2/3 的 选民 相对 于 拉 尔 夫 更 喜欢 乔 
治 。 政 治 偏好 是 另外 一 种 形式 的 非 传递 关系 。 在 差额 选举 中 就 会 导致 排名 前 两 位 
的 候选 人 之 间 的 决战 。 如 果 阿 尔 进入 选举 最 终 决战 的 话 ， 他 的 对 手 很 可 能 就 是 拉 
尔 夫 。 

当 希 德 叔 板 发 现 蜗 子 游 戏 对 他 不 利 时 ， 你 可 以 建议 换 另 外 一 个 玩法 。 你 用 和 
货 子 ， 证 他 用 C 骨 子 ,你 们 每 轮 游戏 都 毛 两 次 骨 子 ， 用 总 数 来 比 大 小 。 因 为 每 次 
掷 仍 子 时 C 出 现 的 数字 会 比 A 的 数字 更 大 的 概率 要 高 ， 那 么 是 不 是 措 两 次 骨 子 
结果 也 更 好 呢 ? 当然 不 是 。 你 每 次 游戏 可 能 得 到 的 点 数 和 是 2，6 和 10， 对 应 的 
概率 分 别 为 4/9，4/9 和 1/9。(a) 当 你 的 骨 子 出 现 的 数字 是 6 而 他 的 货 子 出 现 的 
数字 是 4 或 者 (b) 当 你 掷 出 10 而 他 掷 出 4 或 8 的 时 候 ， 你 都 会 获胜 。 将 这 两 种 情 
况 的 概率 相 加 ， 可 以 得 到 

















G “在 数学 中 传递 关系 R 符合 这 样 的 特征 : 如果 xRy 且 yRz， 那 么 xRz。 典 型 的 例子 就 是 定向 不 等 关 
系 : 当 x>y 且 y>z， 那 么 x >z。 不 定向 的 不 等 关系 是 不 具有 传递 性 的 ， 因 为 即使 我 们 知道 x 去 y 
且 yzz, * 还 是 可 以 等 于 z。 在 石头 剪子 布 游 戏 中 ， 传 递 关系 R 就 是 “打败 ”; 而 在 仍 子 游戏 中 ， 
这 个 传递 关系 就 是 “打败 的 概率 高 于 50% ”。 
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P 忆 (你 赢 ) =4/9 x4/9 +4/9 x8/9 =48/81=0.59 

所 以 虽然 每 一 次 掷 山 子 希 德 披 叔 赢 的 概率 为 56% ， 但 是 当 需 要 掷 两 次 山子 
时 他 赢 的 概率 就 下 降 到 41% 了。 这 与 我 们 在 5.1 节 中 介绍 的 那个 共同 基金 和 固定 
利息 方案 有 些 类 似 。 

当 希 德 叔叔 已 经 不 想 要 继续 在 骨 子 游戏 上 输 钱 时 ， 你 可 以 建议 来 玩 豆 尼 赌 注 
( 译 者 注 : 指 的 是 小 额 赌 注 的 游戏 ) 的 扔 硬币 游戏 。 这 个 游戏 最 早 是 由 数学 家 
沃尔特 . 彭 尼 (Walter Penney) 在 1969 年 发 表 在 《趣味 数学 》 中 的 一 篇 文章 上 
介绍 的 (不 管 之 前 你 被 治 输 过 什么 样 的 思想 ， 发 挥 数学 的 娱乐 功能 是 无 可 指责 
的 )。 假 设 你 现在 扔 三 次 人 硬币， 那么 就 有 如 下 8 种 等 可 能 出 现 的 模式 : 

HHH, HHT, HTH, HTT, THH, THT, TTH, TIT 

如 果 你 和 希 德 叔叔 选择 一 种 模式 然后 再 连续 扔 三 次 人 硬币， 这 个 游戏 就 是 一 个 
公平 的 游戏 了 。 现 在 把 游戏 的 规则 稍 作 改 变 。 你 们 需要 一 直 扔 这 枚 硬币 ， 直 到 你 
选择 的 那 种 模式 出 现 。 比 如 说 你 选择 了 HTH 的 模式 ， 希 德 叔 叔 选 择 了 THT。 如 
果 连 续 十 次 扔 出 来 的 结果 是 

















HTTHHTTTHT 

那么 你 就 输 了 。 这 个 游戏 规则 跟 之 前 说 的 连续 扔 三 次 的 规则 是 不 一 样 的 。 如 
果 有 前 面 的 规则 的 话 ， 这 十 次 结果 对 应 的 是 HIT，HHT 和 TTH 这 三 种 模式 组 合 ， 
第 四 种 组 合 以 T 开 始 。 

这 个 游戏 公平 吗 ? 令 人 惊讶 的 是 结论 未 必 如 此 ， 而 你 可 以 利用 所 识破 的 获得 
优势 。 这 里 的 诡计 在 于 ， 虽 然 每 个 模式 在 任何 三 连 搓 结果 出 现 都 是 同等 可 能 的 ， 
但 有 一 些 模式 在 长 期 的 重复 投掷 中 还 是 比 其 他 的 模式 更 有 可 能 出 现 。 这 看 上 去 自 
相 了 矛盾 ， 但 用 一 个 例子 就 可 以 轻易 说 明 。 假 设 希 德 披 叔 选择 了 HHH 模式 ， 你 选 
择 THH。 他 赢 的 唯一 机 会 是 最 开始 连 扔 三 次 都 是 正面 朝 上 ， 此 时 的 概率 是 1/8。 
如 果 这 个 没有 发 生 ， 你 就 赢 了 。 你 想 一 想 ， 如 果 最 开始 的 三 次 中 任何 一 个 位 置 出 
现 T， 你 就 会 接着 投掷 直到 HHH 出 现 , 但 THH 必然 在 这 之 前 ， 你 就 赢 了 。 因 
此 ， 如 果 希 德 叔 开 选择 HHH， 你 应 该 选择 THH， 赢 的 概率 高 达 7/8 或 者 87. 5% 。 
多 么 悬殊 的 差异 ! 但 是 他 若 选择 了 其 他 模式 会 怎么 样 呢 ? 

这 个 游戏 的 魅力 在 于 不 论 他 选择 了 8 种 模式 中 的 哪 一 种 ， 你 都 可 以 据 此 选择 
你 的 模式 ， 使 得 赢 出 概率 至 少 是 2/31! 如 何 选择 模式 的 基本 规则 就 是 将 其 所 选 模 
式 中 的 前 两 位 字母 作为 你 的 最 后 两 位 。 这 个 策略 背后 的 直觉 是 每 当 他 的 模式 在 下 
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一 轮 投 掷 可 能 出 现时 ， 而 你 的 机 会 已 经 出 现 了 。 比 如 ， 他 选 了 HTH， 前 两 位 字 
母 是 HT， 你 就 应 该 把 这 个 作为 你 的 后 两 位 ， 选 THT 或 者 HHT。 你 很 可 能 同意 
我 ，THT 和 HTH 首先 出 现 的 可 能 性 相同 ， 因 为 它们 看 起 来 一 样 ， 只 是 正 反 面 互 
换 了 而 已 ， 所 以 你 选择 了 HHT。 为 了 证 明 这 赋予 了 你 超过 希 德 叔叔 的 优势 ， 我 
们 再 次 运用 递归 的 方法 考虑 首次 投掷 出 现 的 一 些 不 同情 况 。 

如 果 首 次 投 出 反面 (T) ， 你 需要 重新 开始 ， 因 为 你 们 的 模式 都 是 以 正面 开 
始 的 。 首 次 投 出 正面 (CH) 的 情况 下 我 们 要 看 看 第 二 次 的 结果 。 如 果 还 是 正面 的 
话 ， 你 就 启 了 ， 因 为 希 德 叔 上 扳 不 可 能 在 你 的 HHT 出 现 之 前 得 到 HTH ( 试 一 
试 1) 。 剩 下 的 情况 是 从 HT 开始 ， 第 三 次 可 能 出 现 两 种 情况 : 一 是 正面 朝 上 ， 
希 德 扳 叔 的 HTH 出 现 ， 你 在 第 一 轮 三 连 撞 后 失败 。 另 一 是 反面 朝 上 ， 游 戏 重 新 
开始 。 图 7-2 中 的 树 形 图 ， 就 阐明 了 这 四 种 不 同情 况 。 请 读者 自己 证 明 这 些 就 是 
全 部 的 情况 ， 我 们 并 没有 遗漏 任何 一 种 。 











重新 开始 重新 开始 
图 7-2 希 德 叔 叔 选择 HTH 模式， 你 选择 HHT 模式 可 能 出 现 的 四 种 不 同情 况 
于 浊 现在 你 赢 的 概率 是 多 少 呢 ? 设 概率 为 p， 得 到 一 个 方程 ， 通 常 采用 递归 方法 
处 理 。 我 们 可 以 忽略 你 输 的 情况 ,那么 还 剩 下 三 种 情况 : T，HH，HTT。 你 在 这 
些 情况 中 获胜 的 条 件 概 率 如 下 : 





P(T)=p 
P(HH)=1 
P(HTT) =p 
因为 P(T)=1/2, P (HH)=1/4，P(HTT) =1/8， 根据 全 概率 定律 ， 求 和 得 到 以 
下 方程 : 
p=px1/2+1 x1/4 +p x1/8 
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简化 之 后 得 到 pp = (2 +5 xp)/8， 最 终 计算 出 3 xp =2, 即 p=2/3。 有 2/3 或 
者 67% 的 概率 HHT 在 HTH 之 前 出 现 ， 你 打败 了 和 硕 德 叔叔 。 

简单 的 运算 就 可 以 表明 ， 不 论 希 德 披 叔 选择 什么 模式 ， 你 都 能 做 得 更 好 。 对 
你 而 言 ， 完 整 的 策略 是 : 让 他 的 前 两 位 数字 成 为 自己 的 后 两 位 ， 并 且 绝 不 选择 回 
文 模式 〈 一 种 向 后 和 向 前 读 都 是 一 样 的 模式 ) 。 例 如 ， 如 果 他 选择 了 HITH， 你 则 
有 机 会 在 THT 和 HHT 中 进行 选择 ， 因 为 THT 是 回 文 结构 ， 所 以 必须 放弃 ， 然 后 












































选择 HHT。 表 7-4 列 出 了 你 的 最 佳 选择 和 对 应 的 胜率 。 
表 7-4 ”根据 希 德 叔叔 不 同 的 选择 你 应 当 采 取 的 最 佳 策略 以 及 分 别 对 应 的 获胜 概率 

希 德 叔叔 你 P( 你 胜 ) 
HHH THH 87.5% 
HHT THH 75% 
HTH HHT 66.7% 
HTT HHT 66.7% 
THH TTH 66.7% 
THT TTH 66.7% 
TTH HTT 75% 
TIT HTT 87.5% 








和 上 述 的 搓 仍 子 游 戏 一 样 ， 芝 尼 硬币 游戏 也 是 非 传递 的 。 模 式 没 有 最 好 ， 但 
总 有 更 好 ， 而 希 德 板 叔 则 肯定 会 输 。 

趁 着 希 德 权 叔 在 向 简 阿 姨 解 释 家 庭 预 算 中 为 什么 会 突然 出 现 这 么 大 的 亏空 
时 ， 让 我 们 来 仔细 看 看 每 一 种 模式 具体 是 怎么 产生 的 吧 。 哪 一 种 模式 可 以 打败 另 
外 一 种 模式 归根 到 底 取决 于 出 现 该 特定 模式 的 预期 要 经 过 的 次 数 。 以 HHH 模式 
为 例 ， 假 设 这 个 值 为 hw， 再 次 用 递归 方法 来 计算 它 的 期 望 值 。 我 们 来 考虑 一 下 前 
几 次 扔 硬币 可 能 出 现 的 不 同情 形 。 如 果 第 一 次 反面 朝 上 ， 那 么 我 们 就 需要 再 重新 
开始 扔 ， 继 续 预 期 4 次 后 会 出 现 HHH 模式 。 此 时 的 期 望 值 变 成 了 1 + 人 。 如 果 前 
两 次 都 是 反面 朝 上 ， 那 么 期 望 值 变 成 了 2 + 人 。 而 如 果 前 两 次 都 是 正面 朝 上 ， 第 
三 次 时 又 变 成 反面 朝 上 了 ， 那 么 期 望 值 就 是 3 + 人 。 而 如 果 前 三 次 的 结果 都 是 正 
面 朝 上 ， 那 么 我 们 就 正好 得 到 了 HHH 这 个 模式 ， 此 时 期 望 值 就 是 3。 我 们 描述 
了 T、HT、HHT 和 HHH 这 四 种 排列 出 现 的 情形 ， 对 应 的 概率 分 别 为 /2，1/4， 
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1/8 和 1/8， 因 此 可 以 得 到 公式 
人 =(1+A) Xx1/2+(2+1) x1/4 +(3+1) x1/8 +3 x1/8 

将 这 个 等 式 两 边 同时 乘 以 8， 和 人 简化 之 后 可 以 得 到 8 x =14 +7 xk， 因 此 j= 
14。 那 么 HHH 模式 第 一 次 出 现 的 次 数 的 期 望 值 是 14。 根 据 对 称 性 我 们 可 以 知道 
模式 TTT 出 现 的 期 望 值 也 是 14。 通 过 类 似 的 方法 ， 可 以 得 到 模式 HTH 或 THT 出 
现 的 期 望 值 为 10。 剩 下 的 其 他 模式 出 现 的 次 数 期 望 值 是 8。 所 以 你 对 付 希 德 叔 叔 
的 最 佳 策略 就 是 总 是 选择 剩 下 的 那 四 种 模式 。 和 硕 德 板 板 最 差 的 策略 就 是 选择 
HHH 或 TTT; 他 很 容易 就 会 输 。 稍 微 好 一 些 的 策略 就 是 选择 HTH 或 THT， 然 而 
对 他 来 说 最 好 的 选择 就 是 剩 下 的 那 四 种 模式 ， 但 即使 是 这 样 你 还 有 2/3 的 机 会 可 
以 启 他 。 

看 起 来 每 一 种 模式 出 现 的 概率 是 等 可 能 的 ， 为 什么 期 望 值 却 不 等 呢 ? 这 看 起 
来 非常 的 离异。 难道 这 意味 着 在 一 长 串 序 列 中 THH 出 现 得 更 频繁 吗 ? 不 是 的 。 
这 是 因为 一 旦 HHH 出 现 ,那么 下 一 次 扔 硬币 币 也 出 现 HHH (只 要 下 一 次 还 是 硬 
币 正 面向 上 ) 的 概率 是 1/2; 序列 HHHH 中 包含 了 两 个 HHH 模式 ， 也 就 是 说 这 
种 模式 它 自己 有 直接 复制 衍生 的 能 力 。 但 是 模式 THH 却 没 有 这 种 能 力 ; 如 果 出 
现 一 次 我 们 就 必须 至 少 等 三 次 扔 硬币 才 有 可 能 再 次 出 现 这 种 模式 。 这 就 合理 地 解 
释 了 这 个 悖 论 。 模 式 HHH 自我 复制 能 力 缩短 了 它 下 一 次 出 现 的 时 间 。 从 一 条 长 
长 的 序列 中 ,模式 HHH 会 大 范围 爆炸 式 出 现 ， 而 THH 模式 则 会 变 得 非常 的 分 
散 。 但 是 从 长 期 来 看 这 两 种 模式 出 现 的 概率 却 是 一 样 的 。 

模式 HHH 和 THH 只 是 选择 出 来 代表 不 同 的 模式 的 种 类 。HHH 和 TTT 就 属 
于 “ 慢 ” 类 型 ,它们 可 以 立刻 自我 复制 ; 而 HHT，HTT，THH 和 TTH 就 属于 
“ 快 ” 类 型 ， 它 们 每 一 次 都 要 重新 开始 才能 出 现 。 剩 下 的 HTH 和 THT 则 是 属于 
中 间 类 型 的 。 它 们 自己 不 可 以 立刻 自我 复制 ， 但 也 不 需要 完全 重新 开始 。 它 们 会 
在 两 次 之 后 进行 重复 。 比 如 说 在 序列 HTHTH 中 就 出 现 了 两 次 HTH。 那 么 此 时 在 
一 组 序列 中 出 现 了 多 少 次 “ 重 到 ” 的 情况 变 成 了 关键 的 概念 。 模 式 HTH 重 肥 指 
数 为 1， 因 为 最 后 一 个 H 可 以 是 下 一 个 模式 的 开头 的 HH。 同 理 HHH 的 重 半 指数 
是 2， 因 为 后 两 个 晴 都 可 以 是 新 的 模式 开头 两 个 日 。 剩 下 的 序列 都 不 重 共 。 

数字 3 (在 上 下 文中 ) 并 没有 什么 神奇 之 处 ， 绢 尼 散 子 游戏 中 的 模式 可 以 对 
应 随意 的 nn 次。 基本 的 策略 还 是 遵循 我 上 述 所 说 。 只 要 n=3, 你 就 总 是 能 赢 希 
德 权 叔 ; 如 果 n =2， 你 不 能 保证 每 次 选择 的 模式 都 比 希 德 叔叔 好 。 如 果 他 选择 
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的 是 HT 或 TH， 那 么 你 最 好 也 对 应 选择 TH 或 HT， 这 样 你 有 一 半 的 机 会 可 以 赢 。 
如 果 他 选择 了 HH 或 TT， 那 么 你 随便 选择 TH 还 是 HT 都 可 以 打败 他 。 最 差 的 情 
况 也 是 你 赢 的 概率 和 输 的 概率 一 样 大 ， 其 他 两 种 情况 中 你 都 可 以 有 3/4 (读者 们 
试 着 自己 计算 一 下 吧 ) 的 机 会 赢 。 

对 于 通用 的 长 模式 来 说 ， 适 用 的 基本 原则 与 三 次 是 一 样 的 : 模式 自身 重 释 
的 部 分 越 多 ， 我 们 需要 等 待 它 出 现 的 时 间 就 越 长 。 想 一 想 我 在 3.4 节 中 举 的 “ 毫 
不 起 眼 ”模式 HITHHTHTTHTTTHHTHTTT。 这 相对 于 模式 HHHHHHHHHHHHH- 
HHHHHH 来 说 是 毫 不 起 眼 的 ， 虽然 这 两 种 模式 在 特定 20 次 扔 硬币 试验 中 出 现 的 
概率 都 是 (1/2)”。 但 是 我 的 序列 比 连续 出 现 20 个 正面 向 上 的 模式 更 容易 出 现 ， 
从 这 种 意义 上 来 说 它 确实 是 毫 不 起 上 腿 的 。 连 续 20 次 正面 朝 上 的 情形 中 包含 很 多 
次 重合 ， 所 以 可 以 一 次 又 一 次 地 自我 重复 。 但 是 我 的 序列 从 头 到 尾 都 没有 重 释 
的 部 分 ， 所 以 每 次 都 要 重新 开始 。 许 多 我 们 认为 特殊 的 模式 都 包含 着 一 些 重复 
性 的 特征 ， 如 HTHTHTHTHTHTHTHTHTHT 就 有 2 次 重合 和 4 次 重 阁 ， 而 模式 
HHHHHTTTTHHHHHTTTTT 有 10 次 重大 ,因此 出 现 它 出 现 的 比较 晚 。 与 之 形成 
鲜明 对 比 的 就 是 那些 没有 出 现 重 欠 的 模式 ， 它 们 可 能 一 开始 就 出 现 了 。 但 有 一 些 
不 存在 重 全 的 模式 如 HHHHHHHHHHTTTTTTTTTT 看 起 来 也 非常 的 特殊 。 虽 然 它 
在 20 次 之 内 不 可 能 重复 , 但 是 它 可 以 重复 那些 10 次 以 内 正 反面 交替 的 模式 。 把 
我 们 “特殊 ”定义 的 内 涵 扩 大 到 这 些 模式 也 是 合理 的 。 

对 于 那些 长 度 为 n 的 模式 来 说 ， 要 计算 每 种 模式 的 期 望 等 待 时 间 的 公式 复杂 
很 多 。 在 瑞典 三 巨头 贡 纳 . 布 洛 姆 (Gunnar Blom)、 拉 斯 . 霍 尔 斯 特 (Lars 
Holst) 和 丹尼斯 . 桑 德 尔 ( Dennis Sandell) 的 著作 《概率 世界 的 问题 和 剪影 》 
(Problems and Snapshots from the World of Probability) 提供 了 一 个 很 有 意思 的 数学 
视角 来 看 问题 。 从 这 本 书 中 我 们 可 以 知道 要 出 现 我 上 面 的 那个 “ 训 不 起 眼 ” 的 
序列 平均 需要 超过 一 百 万 次 (概率 为 百 万 分 之 一 ) ， 这 比 出 现 连续 20 次 正面 朝 上 
的 序列 要 多 等 一 倍 的 时 间 。 公 式 其 实 非常 的 简单 ， 我 会 用 具体 的 实例 来 解释 这 些 
公式 。 如 果 一 个 序列 中 开始 个 字符 与 结束 个 字符 相同 ， 则 称 这 个 序列 的 重 竺 
数 为 k。 比 如 序列 HHTHHH 存在 两 次 重 又 ， 一 次 为 1， 一 次 为 2。 当 然 它 还 存在 
为 6 的 重 骆 ， 这 一 点 无 关 紧要 ， 对 于 任何 6 位 序列 都 是 适用 的 。 所 以 它 的 重生 数 为 
1, 2 和 6， 因 此 出 现 的 预期 等 待 次 数 为 : 2' +22 +25 =2 +4+64 =70。HHHHHH 的 
模式 的 重 琶 数 包 含 了 1 ~6， 所 以 期 望 值 为 2 +22 +22 +2 +25 +25 =126。 对 于 那些 
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除了 6 没有 其 他 重 琶 数 的 模式 来 说 ， 比 如 HHTHTT， 它 们 平均 会 在 24 = 64 次 出 
现 一 次 。 用 这 个 公式 来 检验 一 下 我 们 之 前 计算 彭 尼 硬币 游戏 中 的 计算 结 

这 个 公式 还 可 以 被 用 在 其 他 很 多 领域 ， 比 如 计算 有 超过 两 个 符号 的 序列 出 现 
所 需要 等 待 的 次 数 。 比 如 你 已 经 知道 在 掷 恕 子 时 平均 每 六 次 才 可 以 得 到 一 次 数字 
6。 现 在 我 们 需要 在 序列 中 连续 出 现 两 次 6 ( 即 “66” 模 式 ) ， 那 么 需要 等 待 多 少 
次 呢 ? 要 计算 这 个 值 只 需要 依照 前 述 方法 ， 用 2 替换 成 6 (我 们 的 对 象 有 6 种 情 
形 而 非 2 种 ) 就 可 以 计算 出 来 。 因 为 模式 “66” 的 重合 数 为 1 和 2， 所 以 预期 等 
待 的 时 间 是 6' +6” =42。 注 意 在 任何 两 个 连 搓 中 得 到 两 个 6 的 概率 是 1/36， 所 以 
当 我 们 开始 在 每 两 次 之 间 投 掷 的 时 候 我 们 需要 平均 等 2 x36 =72 次 。 第 一 次 出 现 
模式 “66” 是 需要 等 待 42 次 。 成 对 的 计算 方法 使 得 序列 413667 不 满足 模式 
“66” 的 要 求 ， 因 为 它 其 中 包含 的 模式 为 “41”, “36” 和 “67”。 对 于 经 院 数学 
命理 学 家 们 来 说 ， 出 现 模式 “666” 平 均 需 要 等 待 6' +62 +63 =258 次 。 


7.7 :结语 














如 果 你 问 一 个 概率 学 家 赌博 前 景 如 何 ， 得 到 的 答案 一 定 是 否定 的 。 虽 然 偶 尔 
能 赢 ， 赌 博 游 戏 对 于 玩家 总 是 不 利 的 。 大 数 定律 很 肯定 地 告诉 你 不 应 选择 轮 盘 赌 
桌 作为 职业 道路 。 当 然 ， 对 于 概率 学 家 而 言 ， 因 为 在 游戏 和 赌博 中 产生 了 各 式 各 
样 的 概率 问题 ， 而 这 些 问 题 已 经 远 远 不 受 赌场 局 限 ， 在 实际 中 有 着 广泛 的 应 用 。 
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猿 猿 概率， 
走 近 统 计 学 家 



















































































































































































统计 学 家 是 如 何 利用 缴获 的 德军 坦克 编号 推算 出 德军 的 军力 的 ? 
加 州 大 学 伯克利 分 校 是 如 何 用 概率 知识 免 于 被 起 诉 的 ? 
为 什么 父亲 是 个 大 高 个 ， 几 子 却 没有 那么 高 了 ? 
为 什么 被 派 去 火灾 现场 的 消防 人 员 越 多 ， 经 济 损失 越 高 ? 
银色 机 动车 的 事故 概率 更 小 么 ? 
上 急 ， 本 章 一 一 为 你 揭晓 答案 。 
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我 必须 立刻 承认 ， 这 章 是 关于 统计 学 的 。 等 等 ， 别 立刻 把 书 合 上 ! 多 年 的 教 
学 经 验 告诉 我 ， 大 多 数 人 觉得 学 习 统 计 学 和 观看 油漆 变 干 或 者 牙根 管 手术 一 样 无 
聊 。 当 我 为 这 本 书写 提案 时 ， 曾 表示 将 极力 避免 在 书 名 中 提 及 统计 二 字 。 有 一 位 
审 稿 人 指出 ， 确 实 很 多 人 认为 统计 很 乏味 ， 甚 至 有 很 多 人 觉得 概率 简直 令 人 可 
怕 。 但 是 读者 买 了 可 怕 的 书 ， 不 是 吗 ? 如 果 你 曾 将 概率 归 为 可 怕 一 类 ， 那 么 我 希 
望 现在 已 经 帮 你 克服 了 一 部 分 臣 惧 。 

我 的 下 一 个 任务 可 能 更 具 挑 战 性 ， 就 是 向 你 展示 统计 并 非 总 是 那样 乏味 。 你 
可 能 上 过 这 些 大 学 课程 ， 在 课 上 你 的 大 脑 完全 被 显著 性 水 平 、 第 工 类 或 第 下 类 的 
错误 、p- 值 、 关 于 两 个 样本 是 否 异 方差 等 问题 搞 尝 。 你 也 可 能 认为 统计 完全 就 是 
一 些 戴 着 厚 眼 镜片 的 家 伙 一 页 一 页 盯 着 人 口 善 查 资料 ， 以 确定 堪萨斯 州 的 卢 肯 巴 
赫 人 口 是 否 在 过 去 十 年 发 生变 化 。 当 然 ， 统 计 确 实 和 这 些 都 有 关 〈 当然 我 们 也 必 
须 承 认 人 口 普查 资料 所 能 提供 的 卢 肯 巴 赫 的 有 效 信息 是 有 限 的 ， 显 然 无 法 与 当地 
一 位 长 住 居 民 所 存 的 史料 相 媲美 ) 。 不 过 统计 真 的 可 以 很 有 趣 ， 有 时 候 还 很 刺激 。 
让 我 们 听 听 弗朗西斯 盘 士 是 如 何 说 的 ; 

有 些 人 讨厌 统计 这 个 名 字 ， 但 我 觉得 它 充满 了 美和 乐趣 。 

一 一 弗朗西斯 . 高 尔 顿 , 《自然 遗传 》，1889 

看 到 了 吧 ， 这 句 话 把 统计 和 美 与 趣味 相提并论 ， 我 打赌 你 不 可 能 每 天 都 看 到 这 样 
的 说 法 。 如 果 你 以 为 所 有 的 统计 学 家 都 是 冷酷 的 财务 运算 者 ,那么 你 应 该 认识 弗 
罗 伦 斯 . 南 丁 格 尔 〈1820 一 1910) ， 这 位 提 灯 女神 是 善良 与 同情 的 化 映 ， 同 时 也 
是 健康 保健 科学 领域 中 率先 使 用 统计 学 方法 的 先行 者 。 她 运用 统计 学 的 分 析 方 法 
大 幅 降低 民营 医院 和 军事 医院 的 死亡 率 ， 因 此 成 为 英国 皇家 统计 学 会 会 员 和 美国 
统计 协会 荣誉 会 员 。 

你 还 可 能 昕 说 过 一 句 名 言 ( 马克， 吐 温 认为 出 自 于 本 杰 明 . 迪 斯 雷 利 ) “有 
三 种 谎言 : 谎言 、 该 死 的 谎言 和 统计 ”。 达 莱 ' 哈 夫 还 在 雪上 加 霜 ， 他 在 1954 年 
车 有 《统计 陷阱 》， 专 门 描述 如 何 利 用 统计 撒谎 。 作 为 抗衡 ， 继 续 引 用 一 句 弗 时 
西 斯 盘 士 关于 统计 的 思索 : 

“任何 时 候 它们 都 不 是 残酷 野蛮 的 ， 如 果 采 用 高 阶 方法 巧妙 处 理 、 谨 慎 解 释 ， 
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它们 解决 复杂 问题 的 能 力 是 惊人 的 。” 

收集 、 制 表 和 描述 数据 非常 重要 ， 但 弗朗西斯 需 士 所 提 到 的 “高 阶 方法 ” 
是 统计 推 听 ， 它 将 在 运用 概率 理论 分 析 数 据 和 得 出 有 意义 的 结论 中 得 到 运用 。 某 
种 意义 上 而 言 ， 这 只 是 量化 了 的 常识 。 例 如 ， 一 家 制药 企业 试验 新 药 ， 分 别 将 新 
药 和 旧 药 发 给 两 组 病人 。 若 两 组 病人 的 治愈 率 分 别 为 83% 和 67% ， 这 家 企业 是 
否 可 以 得 出 新 药 更 有 效 的 结论 呢 ? 文 持 这 一 主张 的 证 据 可 能 是 83 比 67 多 出 许 
多 ， 但 如 果 数 字 换 成 69 和 67， 泡 怕 没 有 人 认为 其 中 有 实质 性 的 差异 。 企 业 还 想 
得 到 新 药 有 效 性 的 综合 结论 ， 而 非特 定 病人 的 使 用 效果 。 如 果 相同 的 药 发 给 两 组 
新 的 病人 ， 结 果 可 能 大 不 一 样 。 只 要 可 视 的 差异 在 统计 意义 上 足够 大 ， 概 率 结 
就 可 在 此 时 派 上 用 场 。 你 很 快 会 发 现 两 组 中 病人 数量 至 关 重 要 。 如 果 83% 是 5/6 
而 67 和 是 2/3 ， 你 肯定 不 会 做 出 任何 结论 。 大 数 定律 证 明 ， 和 群 组 越 大 结果 越 可 
靠 。 然 而 更 深入 详细 地 分 析 将 得 到 更 复杂 的 结果 。 事 实 上 制药 企业 也 的 确 是 统计 
学 家 的 主要 雇主 。 我 都 不 知道 有 多 少 研 究 生 同学 现在 在 为 英 瑞 合 资 的 制药 巨头 阿 
斯 利康 工作 。 

在 前 几 章 我 们 已 提 到 过 统计 学 ， 比 如 “统计 概率 "”。 如 果 一 位 气象 学 家 当时 
观测 到 特定 的 一 组 天 气 变 化 ， 有 25% 的 可 能 会 降雨 ， 他 可 以 直接 说 降水 概率 为 
25% 。 他 所 做 的 就 是 在 现 有 数据 的 基础 上 估算 降水 概率 。 随 着 数据 收集 的 增加 ， 
佑 值 可 能 变化 。 大 数 定律 告诉 我 们 数据 收集 得 越 多 ， 估 值 越 准确 。 虽 然 没 有 指 
明 ， 但 大 多 数 的 统计 理论 和 方法 论 都 依赖 于 大 数 定 律 。 一 个 早期 的 例子 ， 巴 
特 . 荷兰 (Bart Holland) 在 2002 年 出 版 的 《什么 是 可 能 性 》 一 书 中 提 到 科 贝 尔 
(J. Koelbel) 先生 曾 在 1584 年 提议 确定 长 度 单位 “英尺 ”数值 的 方法 。 他 建议 
随机 挑选 离开 教堂 的 16 位 男性 ,“ 当 他 们 刚好 出 门 时 ”， 让 他 们 将 左 脚 排 成 一 队 ， 
然后 测量 总 长 度 。 用 总 长 度 除 以 16 就 得 到 了 “准确 和 法 定 的 英尺 长 度 ”。 科 贝尔 
当时 就 已 经 发 现 了 平均 值 对 消除 个 体 差异 的 重要 性 ， 并 且 成 功 赋予 了 英尺 普遍 接 
受 的 定义 。 

另 一 个 证 明 统 计 方法 有 效 的 有 趣 例子 源 于 第 二 次 世界 大 战 。1943 年 ， 美国 
驻 伦 敦 大 使 馆 的 战 时 经 济 部 门 着 手 分 析 缴 获 的 德国 装备 序列 号 ， 比 如 炸弹 、 火 箭 
和 坦克 。 和 这 些 数据 打交道 的 统计 学 家 想 出 了 一 个 聪明 的 办 法 来 评估 德国 的 军 
力 。 以 坦克 为 例 ， 假 设 德国 人 拥有 w 辆 坦克 ， 排 号 1 ~ N， 问 题 就 是 如 何 根据 已 
知 序列 号 求 出 N 的 大 小 。 简 而 言 之 ， 若 盟 军 缴获 三 辆 坦克 ， 序 列 号 分 别 为 89、 
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123 和 150。 那 么 如 何 求 NN 值 呢 ?有 很 多 种 方法 ,虽然 没有 放 之 四 海 丝 准 的 答案 ， 
但 目测 NN 显然 远 远 大 于 150。 这 个 可 以 通过 从 1，2，…, NN 中 随机 抽样 三 个 观测 
数据 所 得 出 的 最 大 期 望 值 是 0.75 xN (观测 数据 是 均匀 分 布 的 ) ， 鉴 于 0.75 x200 = 
150， 得 出 =200。 注 意 这 种 估 值 是 如 何 基 于 概率 计算 得 出 ,，“ 高 阶 方法 ”由 此 
全 面 展开 。 当 然 ， 后 续 还 有 很 多 方法 用 于 改善 估 值 的 过 程 ， 不 过 我 们 最 好 还 是 就 
此 结束 这 个 故事 ， 不 再 探讨 技术 性 的 细节 。 

战争 结束 后 ， 统 计 学 家 们 才 得 到 了 答案 。 但 真实 的 答案 的 情况 并 不 为 人 所 
知 ， 这 在 统计 学 界 是 很 少见 。 事 实证 明 这 些 戴 着 厚 眼镜 片 的 统计 学 家 们 表现 出 
色 ， 远 胜 于 英美 的 情报 部 门 。 当 时 的 理 查 德 . 拉 格 尔 斯 (Richard Ruggles) 和 享 
利 … 布 罗 迪 (Henry Brodie) 1947 年 在 《美国 统计 协会 杂志 》 上 发 表 了 《第 二 次 
世界 大 战 时 经 济 的 实证 研究 》， 你 可 以 在 里 面 找到 更 多 关于 第 二 次 世界 大 战 统计 
应 用 的 例子 。 表 8-1 正 是 三 个 不 同月 份 的 产量 数据 。 其 中 ， 统 计 学 家 和 情报 人 员 
的 估 值 对 比 都 来 源 于 Speer 部 门 的 官方 数字 。 可 以 看 出 ， 情 报 估 值 被 严重 夸大 。 

表 8-1 第 二 次 世界 大 战 期 间 德 国 坦克 月 产量 的 预 估 值 和 实际 值 



































时 间 统计 估 值 情报 估 值 实 际 值 
1940.6 169 1000 122 
1941.6 244 1550 271 
1942. 8 327 1550 342 














接 下 来 我们 将 学 习 一 些 统计 学 的 普通 应 用 。 这 个 过 程 可 能 不 如 之 前 学 习 概 
率 时 系统 ， 我 会 挑选 一 些 有 趣 的 问题 和 应 用 。 最 后 ， 我 希望 你 们 记 住 弗朗西斯 一 
士 的 格言 “巧妙 处 理 ， 消 灭 野 蛮 ”。 准 备 好 了 吗 ? 我 们 现在 开始 ! 

















8.2 40% 的 胜率 意味 着 有 95% 的 可 能 当选 总 统 





每 天 媒体 上 都 充斥 着 各 种 关于 民意 调查 的 报道 。 这 周 (2006 年 5 月 的 第 二 
周 ) ,我 从 媒体 上 得 知 70% 的 美国 人 因为 高 油价 改变 了 驾车 习惯 ,54% 的 加 拿 大 
人 反对 向 阿富汗 派 军 ，5$19% 的 美国 人 对 汤姆 克 鲁 斯 印象 不 佳 。 我 们 一 直 在 持续 
跟踪 总 统 的 支持 率 ， 在 选举 前 ， 各 种 民 调 公司 和 机 构 发 布 的 民 调 结果 眼花 综 乱 。 
很 多 民 调 结果 并 未 公开 ， 政 党 和 候选 人 们 会 进行 秘密 调查 ， 和 弄 清 民众 关心 的 重要 
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议题 ， 从 而 确定 选举 策略 。 公 开 的 政治 民 调 为 民 调 公 司 提供 了 一 条 赢得 良好 声誉 
的 捷径 ， 但 他 们 的 盈利 主要 来 源 于 为 企业 所 做 的 民意 调查 。 当 一 家 公司 打算 上 市 
新 产品 时 ， 就 会 雇佣 民 调 公司 确定 消费 者 是 否 会 购买 产品 。 我 曾 接 到 关于 某 品 牌 
洗 发 水 的 调查 电话 ， 被 问 到 以 下 问题 : 中 是 否 使 用 特定 品牌 的 洗 发 水 ; 名 是否 每 
天 饮用 栖 计 ; @@ 是 否 养 狗 。 在 我 挂 了 这 家 公司 向 我 介绍 它们 橙 味 宠物 狗 洗 发 水 的 
电话 后 ， 我 确定 民 调 公司 只 是 为 了 省 时 省 力 而 简单 地 把 三 个 不 同 的 调查 放 到 了 
一 起 。 

假设 总 统 支 持 率 为 44% ， 这 意味 着 什么 呢 ? 首先 ， 它 显然 不 是 说 总 人 口 的 
40% 都 必定 支持 总 统 。 这 要 每 个 人 都 挨个 问 才 能 确定 。 民 意 调 查 背 后 的 想法 是 ， 
既然 不 能 每 个 人 都 问 ， 那 么 就 问 1000 个 人 的 看 法 。 如 果 400 个 人 对 总 统 的 表现 
表达 了 支持 ， 就 声称 他 得 到 了 40% 的 支持 率 。 这 个 数字 成 为 了 无 法 确 知 的 总 人 
口中 支持 总 统 比 例 的 估计 值 。 估 计 值 的 准确 性 取决 于 边际 误差 (或 抽样 误差 ) 。 
比如 ， 边 际 误差 车 公布 为 3% ， 支 持 率 的 区 间 则 为 40 +3 或 者 [37，43 ] 。 那 么 
这 又 意味 着 什么 呢 ? 我 们 现在 就 可 以 确定 总 人 口 的 真实 支持 率 在 37% 和 43% 之 
间 了 吗 ? 

不 尽 然 吧 。 考 虑 到 随机 性 ， 我 们 根本 不 能 确定 任何 事 。 能 达到 较 高 的 确定 性 
就 应 该 满足 了 ， 这 才 是 可 能 实现 的 。 举 个 例子 ,假设 真实 的 支持 者 占 50% ,在 
一 个 1000 人 的 样本 里 如 何 得 出 40% 或 更 低 的 支持 率 呢 ? 这 就 和 扔 1000 次 硬币 使 
头像 朝 上 的 概率 小 于 400 次 的 情形 一 样 ， 计 算 机 算出 这 种 情况 的 概率 大 概 为 百 亿 
分 之 一 。 所 以 如 果 我 们 的 样本 概率 是 40% ， 那 么 真实 的 比例 不 太 可 能 高 达 50% 。 
在 民 调 中 ， 由 于 不 知道 真实 的 比例 ， 情 况 会 更 糟 些 。 问 题 就 变 成 了 在 我 们 所 观测 
到 的 数字 和 边际 误差 的 区 间 中 捕捉 到 真实 比例 的 可 能 性 有 多 大 ? 让 我 们 用 稍微 正 
式 的 理论 观点 看 这 个 问题 。 

假设 真实 比例 为 »， 取 值 范 围 为 0 ~1， 观 测 到 的 比例 为 》 (在 统计 理论 中 通 
常 使 用 “帽子 ”来 标志 菜 数 据 的 估 值 ), 边际 误差 为 。, 问题 是 区 间 
[5 -a, 5+s|] 中 包含 p 的 概率 是 多 少 。 这 个 可 以 用 中 心 极限 定理 计算 。 选 取 = 尽 
量 达 到 我 们 期 望 的 最 大 概率 ， 不 过 要 记 住 概率 越 大 ，s 的 值 就 越 大 。 但 我 们 希望 
边际 误差 < 尽 可 能 小 ， 所 以 就 需要 一 个 折 中 。 结 论 是 选取 p 的 ， 标 准 通常 采用 
95% 。 这 个 数字 被 称 为 置信 水 平 ， 表达 了 我 们 对 p 成 功 落 入 区 间 ( 称 为 置信 区 
间 ) 的 信心 程度 。 区 间 的 公式 转变 为 以 下 形式 : 
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p =f +1.96 x 尼 x(1-P) -$4 边际 误差 
n 


n 指 样本 中 的 个 体 数量 ,公式 表示 未 知 的 真实 比例 p 有 95% 的 概率 落 入 P+ 边际 
误差 区 间 。 换 而 言 之 ,每 20 个 这 样 的 区 间 ， 平均 有 19 个 区 间 中 有 p， 只 有 1 个 
区 间 不 包含 。 值 得 注意 的 是 边际 误差 随 着 样本 容量 的 增加 而 缩小 ， 因 此 ， 访 问 的 
民众 越 多 ， 民 调 就 越 可 信 。 这 个 公式 还 说 明了 样本 容量 的 影响 。 系 数 1. 96 与 概 
率 95% 相关 联 2 ， 如 果 想 有 更 高 的 置信 水 平 ， 就 必须 提高 这 个 数字 ， 比 如 ， 要 达 
到 99% ， 就 要 用 2. 58 取代 1. 96。 

回 到 之 前 虚构 但 可 行 的 例子 ， 对 1000 人 进行 民 调 ， 有 400 人 支持 总 统 。 广 = 
0.4, n=1000， 将 其 代入 公式 ， 那么 区 间 就 是 














0.4x0.6 
1000 


或 者 用 概率 表示 ，(40 +3)%。 计 算 区 间 的 过 程 正 是 我 之 前 提 到 有 关 “ 量 化 常 
识 ” 的 典型 例子 。 我 们 想 知 道 总 统 支 持 者 的 比例 ， 显 然 不 可 能 对 每 个 选民 进行 一 
一 询问 。 而 如 果 是 调查 1000 位 随机 选取 的 民众 ， 那么 至 少 对 支持 比例 有 一 个 初 
步 了 解 。 样 本 中 的 信息 并 不 完美 ， 但 远 非 无 用 。 在 置信 水 平和 边际 误差 的 帮助 
下 ， 我 们 有 95% 的 概率 能 够 得 到 真实 的 人 口 比例 。 

很 多 民 调 的 边际 误差 都 保持 在 3% 左右 ， 这 并 非 巧 合 。 正 如 我 所 述 ， 置 信 水 
平 的 标准 值 为 95% ， 则 系数 为 1.96， 如 果 观 测 比例 与 0.5 接近 ， 比 如 在 0.3 和 
0.7 之 间 , Px (1 - 广 ) 的 平方 根 大 约 为 0.5。 而 1.96 约 等 于 2， 所 以 两 者 相 乘 的 
结果 大 约 是 1， 边 际 误差 就 约 为 1/yn， 用 百分比 表示 就 是 100/Yn， 这 是 个 非常 方 
便 记忆 的 方法 : 


p=0.4+1.96x =0.4 +0.03 


























边际 误差 一 一 一 一 -% 


假设 样本 容量 约 为 典型 的 1000， 边 际 误 差 就 是 3% 。 即 使 比例 远离 50% ， 这 个 方 
法 依然 有 效 ， 因 为 伴随 着 比例 的 偏离 ， 也 能 得 出 边际 误差 的 最 大 值 。 在 美国 总 统 
选举 的 民 调 中 ， 两 大 党 的 候选 人 都 接近 于 占 比 50% ， 所 以 1000 样本 容量 的 边际 





”这 个 联系 基于 正 态 分 布 计算 。 在 正 态 分布 中 ， 标 准 差 为 1.96 时 观测 对 象 的 概率 为 95% 。 不 过 ， 
既然 我 没有 解释 置信 区 间 的 创立 过 程 以 及 它 和 正 态 分 布 的 关系 ， 就 不 青 袭 述 相关 细节 。 
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误差 一 般 都 是 3% 。 同 时 需要 注意 的 是 ， 边 际 误 差 所 减少 的 幅度 是 样本 容量 增加 
幅度 的 平方 根 。 所 以 ， 如 果 从 1000 增加 到 10000， 边际 误 差 则 从 3% 减少 到 
1% 。 但 民 调 费时 费力 ， 单 纯 增 加 样本 容量 并 不 经 济 有 效 。 所 以 现在 很 少 有 民 调 
的 样本 超过 几 千 个 人 。 

我 们 既然 已 经 了 解 ， 当 询问 美国 的 1000 个 人 时 边际 误差 为 3% 。 那 么 其 他 国 
家 呢 ? 中 国 的 人 口 4 倍 于 美国 ， 你 要 问 多 少 人 才能 得 到 同样 的 边际 误差 ? 4000 
吗 ? 好 好 看 看 上 面 说 过 的 计算 和 公式 ， 哪 里 提 到 过 和 人 口 规模 有 关 ? 没有 ! 1000 
个 人 民 调 的 边际 误差 是 相同 的 ， 不论 是 在 中 国 、 美 国 、 加 拿 大 还 是 墨西哥 ! 乍 一 
看 这 可 能 看 似 令 人 大 吃 一 惊 ,但 事实 上 这 并 非 完 全 准确 。 在 计算 边际 误差 时 ， 包 
括 了 一 些 近似 值 。 但 只 要 样本 容量 和 整个 人 口 规模 相 比 足够 小 ， 这 就 是 有 效 的 。 
1000 个 中 国人 仅 是 他 们 国家 的 代表 ，1000 个 美国 人 也 是 如 此 。 然 而 ， 如 果 我 
们 问 1000 个 梵蒂冈 人 ,那么 可 能 已 经 问 壳 所 有 人 ， 边 际 误差 为 0 (我 不 知道 
教皇 的 民 调 结果 是 否 公布 ， 但 我 想 任何 低 于 100% 的 支持 率 都 会 被 认为 是 一 败 
涂 地 ) 。 

2005 年 秋天 ， 媒 体 报道 小 布什 总 统 的 支持 率 首 次 跌 破 40% 。 某 种 程度 上 ， 
这 其 实 是 毫 无 意义 的 声明 。 虽 然 事实 可 能 是 前 次 民 调 结果 显示 支持 率 为 41%， 
下 次 结果 则 为 39% ， 这 些 数 字 的 边际 误差 都 是 3% ， 若 建立 起 相关 的 置信 区 间 ， 
你 就 会 发 现 部 分 数值 是 重合 的 。 没 有 边际 误差 的 41% 和 39% 不 能 说 明 一 切 ， 只 
有 被 我 们 表述 为 区 间 [38, 44] 和 [36, 42] 时 才 有 意义 。 而 且 我 们 也 不 能 排 
除 两 次 民 调 间 支 持 率 存在 上 升 的 情况 。 只 有 当 两 者 差异 大 到 完全 超过 边际 误差 
时 ， 才 能 被 称 为 具有 统计 显著 性 。 而 只 有 当 差 异 具 有 显著 性 时 ， 才 能 下 结论 。 记 
者 和 权威 们 总 是 喜欢 过 度 分 析 民 调 结果 ， 即 使 无 中 生 有 也 要 找 出 趋势 和 倾向 。 相 
反 ， 收 到 偏 低 民意 支持 率 的 政要 们 常常 评论 到 他 们 出 去 “与 民众 交谈 ”时 有 完 
全 不 同 的 “感受 ”"。 因 此 ， 重 要 的 是 既 不 过 度 重 视 也 不 轻视 民 调 。 它 们 就 应 该 是 
本 来 的 样子 ,不 多 不 少 。 

即使 建立 统计 显著 性 ， 当 然 也 不 是 和 现实 完全 相同 了 。95% 的 置信 水 平 说 明 
还 有 5% 的 可 能 为 统计 显著 性 差异 并 非 真 实 而 纯 属 偶然 。 然 而 ， 我 们 若 过 度 考 虑 
这 件 事 ， 民 调 就 会 完全 陷 人 毫 无 意义 ， 当 然 事实 上 并 非 如 此 。 只 要 符合 “统计 学 
事实 ”就 可 以 了 。 

民 调 中 常 报道 边际 误差 ， 但 我 记得 有 一 个 明显 的 例外 。1995 年 ， 瑞 典 在 经 
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历 多 年 争论 和 公投 后 终于 加 入 欧盟 。 公 投 前 不 久 ， 一 家 报纸 的 标题 是 “多 数 瑞典 
人 支持 加 入 欧盟 " 。 这 是 因为 一 项 民 调 中 50.5% 的 人 表达 了 对 加 入 欧盟 的 支持 ， 
然而 ， 为 了 得 到 以 上 报纸 的 结论 ， 必 须 将 边际 误差 降 到 0. 5% 以 下 ， 导 致 置信 水 
平 只 有 25% ! 换 而 言 之 ， 在 该 边际 误差 内 ， 仅 有 四 分 之 一 的 民 调 能 够 成 功 把 握 
正确 的 支持 比例 。 这 显然 是 毫 无 用 处 的 。 我 质问 报纸 的 政治 版 编辑 为 什么 不 刊登 
边际 误差 ， 只 得 到 这 样 的 回答 ,“ 啊 ， 忘 了 ”。 不 必 说 ， 这 家 报纸 显然 支持 瑞典 
加 入 欧盟 。 
置信 水 平 被 用 于 判定 边际 误差 的 可 依赖 程度 ， 但 很 少 被 报道 。 一 个 例外 是 加 
拿 大 的 民 调 声称 “3. 1% 的 边际 误差 表示 19/20 的 可 能 性 ”。 虽 然 出 于 好 意 ， 但 如 
果 你 先前 不 知道 它 的 含义 ， 这 个 声明 可 能 更 令 人 困惑 。19720 意味 着 95% ， 据 我 
所 知 ， 所 有 的 民 调 公司 都 采用 这 个 数据 ， 大 家 似乎 达成 了 共识 ， 即 95% 的 确定 
性 就 是 一 个 坎 ， 再 低 一 点 结果 就 不 那么 可 信 ， 而 再 高 一 点 边际 误差 就 太 大 了 。 就 
总 统 选举 前 的 民 调 而 言 ， 民 调 公 司 之 间 在 正确 的 民 调 结果 上 竞争 激烈 ， 所 以 采用 
相同 的 置信 区 间 是 比较 合理 的 。 

确保 样本 具有 被 研究 总 体 的 代表 性 ， 对 于 任何 民 调 来 说 都 是 重要 的 。 有 很 多 
做 法 都 会 违反 这 个 要 求 。 读 研究 生 的 时 候 ， 作 为 课程 的 一 部 分 我 和 其 他 同学 开始 
从 事 统 计 咨 询 。 其 中 有 一 个 客户 是 专门 进行 重建 手术 的 外 科 医 生 。 他 希望 评估 自 
己 的 手术 结果 ， 就 询问 其 他 医生 的 意见 。 出 示 了 病人 的 照片 后 ， 医 生 们 则 被 要 求 
根据 多 元 的 评估 标准 确定 手术 的 品级 。 我 审视 他 的 数据 时 ， 发 现 多 数 医生 意见 都 
是 一 致 的 ， 但 有 一 位 的 评级 和 其 他 人 始终 不 同 。 问 到 我 的 客户 时 ， 他 笑 着 说 
“ 哦 ， 那 是 卡尔 森 医 生 ， 他 是 一 位 全 科 医 生 ， 所 以 完全 不 懂 ”。 我 的 客户 将 卡尔 
森 医生 纳入 ， 用 来 增加 样本 。 可 能 一 些 统计 课程 告诉 他 样本 越 大越 好 ,但 如 果 他 
真 想 通过 民 调 得 到 专家 们 的 意见 ， 那 么 将 可 怜 又 无 知 的 卡尔 森 医 生 纳入 样本 之 中 
对 他 没有 任何 好 处 。 

男 一 个 没有 代表 性 的 样本 例子 是 假设 你 在 家 附近 做 晚间 散步 ， 发 现 你 看 到 
的 20 个 人 里 有 14 个 人 都 在 稳 狗 ， 可 以 得 出 结论 70% 的 邻居 都 养 了 狗 吗 ? 榴 怕 
不 能 。 这 就 是 选择 性 偏差 的 例子 ， 从 总 体 上 看 ， 你 在 街 上 遇 到 的 人 更 可 能 是 狗 
主人 而 不 是 你 的 邻居 ， 所 以 他 们 不 是 具有 代表 性 的 样本 。 选 择 性 偏差 是 足以 导 
致 假 结 论 的 严重 错误 。 在 下 一 节 ， 我 们 将 探讨 美国 总 统 选 举 中 的 两 个 著名 


案例 。 
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8.3 民 调 数据 与 选举 结果 


1936 年 总 统 选举 前 , 《文摘 》 杂志 公 布 了 一 项 民 调 结果 ， 预 计 共 和 党 候选 人 
阿尔 夫 . 兰 登 在 与 总 统 富兰克林 ' 罗斯 福 的 对 决 中 能 够 轻易 取胜 : 兰 登 的 支持 率 
为 57% ， 罗 斯 福 为 43% 。《 文 摘 》 自 1916 年 后 成 功 预测 了 每 一 任 总 统 选举 结果 ， 
因而 拥有 良好 的 声誉 ， 而 且 民 调 得 到 了 230 万 民众 的 回复 。 是 的 ， 你 看 得 没 错 ， 
230 万 民众 ! 选举 结果 呢 ? 罗斯 福 得 到 (选票 投 给 他 们 俩 其 中 之 一 的 民众 ) 62% 
支持 率 ， 兰 登 只 得 到 38% ， 成 为 历届 总 统 选 举 胜 负 最 悬 珠 的 一 届 之 一 。《 文 摘 》 
民 调 从 此 作为 最 差 的 一 届 民 调 载 人 史册 ， 杂 志 不 久 后 也 因此 倒闭 。 

这 究竟 是 怎么 发 生 的 ? 根据 以 上 的 经 验 法 则 ，230 万 民众 可 将 边际 误差 降 到 
0. 07% ， 所 以 预测 结果 本 应 该 基本 确定 。 是 什么 事 突 然 发 生 使 得 人 们 改变 了 心 
意 ? 不 ， 错 误 在 于 《文摘 》 所 采用 的 方法 。 只 有 当 我 们 随机 选取 样本 时 ， 也 就 
是 说 每 个 人 被 选取 的 可 能 性 相同 时 ， 取 决 于 边际 误差 的 预测 才 有 可 信和 度 。 理 论 上 
应 该 有 一 个 全 部 选民 的 名 单 ， 从 中 选取 230 万 人 人， 预测 结 果 就 会 很 准确 。 但 《 文 
摘 》 杂 志 并 没有 这 么 做 ， 它 犯 了 两 个 错误 ， 产 生 严 重 偏离 的 结果 。 

第 一 个 错误 是 选择 性 偏差 。 当 他 们 选取 民 调 对 象 时 ， 采 用 了 多 种 可 用 地 址 名 
单 ， 比 如 订阅 名 录 、 电 话 号 码 矫 、 机 动车 注册 表 和 俱乐部 会 员 名 单 。 但 这 时 正 处 
于 大 萧条 ， 除 非 有 可 支配 收入 ， 否 则 不 可 能 出 现在 这 类 名 单 上 。 一 个 刚刚 加 入 民 
间 资 源 保护 团 的 年 轻 人 不 太 可 能 将 他 的 零用 钱 花 在 《文摘 》 杂 志 的 订阅 上 ， 而 
失业 钢铁 工人 也 不 可 能 打算 加 入 当地 乡村 俱乐部 。 汽 车 和 电话 也 不 像 今天 这 么 普 
遍 ， 只 有 25% 的 家 庭 拥 有 电话 。 对 个 体 的 选取 倾向 于 富 人 ， 而 1936 年 的 富 人 ， 
不 太 可 能 支持 罗斯 福 新 政 所 采用 的 比 兰 登 限 制 性 更 严 的 财政 政策 。 这 可 能 是 选民 
们 间 的 分 裂 第 一 次 影响 《文摘 》 民 调 的 选举 年 份 。 毕 竟 ， 他 们 之 前 还 是 成 功 预 
测 了 正确 结 

第 二 个 错误 是 无 应 答 偏差 。《 文 摘 》 向 1000 万 民众 寄 送 了 明信片 ， 并 将 民 调 
建立 在 收 到 的 230 万 张 卡片 上 。 你 可 以 想象 ， 一 个 最 近 失 业 的 钢铁 工人 即使 收 到 
了 《文摘 》 的 明信片 ， 但 可 能 更 关心 如 何 养活 家 人 ， 而 非 填 写 卡 片 并 把 它 寄 回 
杂志 社 。 选 择 性 偏差 所 造成 的 误差 再 次 被 无 应 答 偏差 强化 了 ， 即 使 230 万 本 身 看 
起 来 让 人 印象 深刻 ,但 23% 的 回复 率 并 不 高 。 可 能 推测 的 是 无 应 答 偏差 对 兰 登 
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有 利 ， 但 在 一 项 特别 民 调 显示 超过 一 半 回 复 支持 兰 登 的 芝加哥 ， 罗 斯 福 仍 然 赢 取 
了 三 分 之 二 的 选票 。 芝 加 哥 民 调 的 回复 率 为 20% ， 因 为 个 体 由 登记 的 选民 名 单 
中 选取 ， 所 以 没有 受到 选择 性 偏差 的 影响 。 

1936 年 的 选举 中 , 《文摘 》 还 面临 来 自 于 几 个 初创 公司 的 竞争 。 阿 契 伯 德 ， 
克 罗 斯 利 ， 乔 治 . 羡 洛 普 和 爱 蒙 . 罗 珀 是 三 位 聪明 的 年 轻 人 ， 同 时 也 是 三 家 公司 
的 创始 人 ， 他 们 意识 到 样本 必须 依次 随机 选取 以 确保 结果 的 可 靠 性 。 每 个 人 都 预 
测 罗斯 福 胜 利 ， 盖 洛 普 甚 至 准确 预测 了 《文摘 》 的 错误 结果 ， 这 一 项 壮举 使 得 
盖 洛 善 超越 其 他 人 成 为 民 调 第 一 人 人。 随后， 英国 1945 年 选举 中 ， 在 几乎 所 有 人 
都 看 好 丘吉尔 的 时 候 ， 他 成 功 预 测 了 丘吉尔 的 败绩 ， 从 而 在 欧洲 声名 静 起 。 

1936 年 的 美国 总 统 选举 中 ， 羡 洛 普 基 于 随机 选取 的 5 万 人 ， 预 测 罗斯 福 获 得 
56% 的 支持 率 ( 比 实际 的 62% 稍微 少 一 些 )。 而 且 ， 根据 《文摘 》 所 用 名 单 上 随 
机 选取 的 3000 人 样本 ， 盖 洛 普 预计 该 杂志 对 罗斯 福 的 预测 率 为 44% 。 盖 洛 普 意 
识 到 3000 样本 已 经 足够 反映 名 单 上 1000 万 选票 的 走向 ， 而 庞大 的 230 万 样本 容 
量 因 为 选择 过 程 从 一 开始 就 出 现 偏差 必 将 无 济 于 事 ， 见 表 8-2。 

表 8-2 1936 年 选举 中 罗斯 福 的 民 调 数据 和 选举 数据 



















































































来 源 罗斯 福 支 持 率 
选举 结果 62 
盖 洛 普 56 
文摘 43 
盖 洛 普 预 测 的 文摘 44 





然而 12 年 后 , 《文摘 》 厅 志 的 失业 编辑 终于 能 报 一 稍 之 仇 。1948 年 的 美国 
总 统 选举 发 生 了 史上 第 二 有 名 的 错误 民 调 ， 这 次 轮 到 盖 洛 普 公 司 出 错 了 。 你 可 能 
看 过 哈里 .杜鲁门 的 著名 照片 ， 照 片 里 他 拿 着 《芝加哥 日 报 》， 报 道 的 名 字 叫 做 
《杜威 击败 杜鲁门 》， 而 他 刚刚 赢得 了 选举 。 克 罗斯 利 、 羡 洛 普 和 罗 珀 预计 共和 
党 候选 人 托马斯 . 杜威 将 以 5% ~7% 的 差距 胜出 ， 但 事实 完全 相反 。 这 次 是 哪里 
出 错 了 呢 ? 

盖 洛 普 公 司 失 败 的 原因 还 是 在 于 三 个 民意 测验 专家 在 抽样 时 没有 摆脱 所 有 的 
偏差 。 他 们 正确 地 意识 到 若 能 确保 样本 真实 反映 人 口 构成 ， 民 调 结果 就 会 更 准 
确 。 因 此 ， 他 们 在 样本 组 成 上 精 挑 细 选 ， 选 取 男 女 各 半 ， 还 包括 种 族 、 年 龄 和 收 
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入 等 多 样 化 的 人 口 特征 。 民 调 的 过 程 就 是 访问 者 拜访 并 询问 被 抽取 对 象 的 意见 。 
但 是 有 一 次 ， 访 问 者 被 通知 必须 访问 芝加哥 郊区 5 个 四 十 岁 以 上 的 白人 ， 具体 的 
对 象 可 以 随意 选择 ， 洪 在 的 偏差 就 此 产生 。 不 管 出 于 你 能 想象 的 什么 原因 (更 友 
善 的 邻居 、 车 道上 更 闪 亮 的 车 吸引 了 注意 力 、 刚 好 在 家 的 家 庭 主 妇 为 你 开门 )， 
访问 者 们 倾向 于 不 均衡 地 访问 更 多 杜威 支持 者 。 这 并 非 巧 合 ， 因 为 民 调 专家 们 在 
1936 ~ 1948 年 间 持续 高 估 共 和 党 人 的 选票 。 共 和 党 人 较 容 易 接受 访问 ， 因 而 导 
致 结果 发 生 偏差 。 但 只 有 在 1948 年 两 党 间 的 差距 微小 ， 一 点 偏差 即 让 民 调 专家 
预测 了 共和 党 的 胜利 。1948 年 选举 结果 和 预测 数据 见 表 8-3。 
表 8-3 1948 年 克 罗 斯 利 、 盖 洛 普 和 罗 珀 三 家 民 调 专家 的 预测 数据 和 实际 选举 结果 























民 调 专家 
克 罗 斯 利 盖 洛 普 罗 珀 选举 结果 
候选 人 
杜鲁门 45 44 38 50 
杜威 50 50 53 45 
其 他 候选 人 5 6 9 5 























为 了 尽量 避免 选择 性 偏差 ， 民 调 一 开始 样本 中 所 包括 的 个 体 就 必须 被 认定 。 
如 果 是 通过 电话 完成 访问 ,访问 者 必须 与 被 抽取 的 人 交谈 ， 而 不 是 任何 碰巧 接 起 
电话 的 人 。 如 果 是 当面 访问 ， 即 使 当时 没 人 在 家 ， 也 不 能 作为 替代 转 而 访问 邻居 或 
者 邮差 。 选 择 性 偏差 的 一 种 现代 形式 源 于 电话 短 民 调 ， 而 越 来 越 多 的 人 尤其 是 年 轻 
人 只 有 手机 没有 座机 ， 就 此 被 排除 在 样本 之 外 。 这 种 方式 对 政治 民 调 结果 的 影响 程 
度 尚 不 明确 ， 但 如 果 问 题 是 关于 是 否 支 持 在 公共 场所 禁止 手机 ， 则 肯定 影响 重大 。 

避免 无 应 答 偏 差 更 加 困难 ， 但 民 调 公司 通常 尝试 联系 多 次 ， 直 到 最 后 放弃 。 
如 果 无 应 答 随 机 发 生 且 数量 不 大 的 话 ， 倒 是 不 成 问题 ， 但 若是 被 认为 导致 结果 扭 
曲 ， 就 是 很 大 的 问题 了 。 假 如 一 个 通过 邮件 开展 的 民 调 问 的 是 人 们 对 垃圾 邮件 的 
态度 一 一 阅读 或 弃 之 不 顾 ， 会 怎么 样 呢 ? 无 应 答 导 致 民 调 中 报告 的 人 数 通 常 不 是 
整数 ， 而 是 像 1014 这 样 的 数字 ， 这 就 说 明 1500 人 中 可 能 有 486 人 没有 应 答 。 

无 应 答 的 一 种 特殊 形式 是 民 调 问题 有 可 能 引发 尴 众 或 者 是 其 他 让 人 有 负担 的 
问题 。 在 这 种 情况 下 ， 人 们 可 能 不 太 愿 意 回 答 或 者 不 会 说 出 真 话 。 比 如 ， 关 于 毒 
品 和 其 他 非法 行为 的 问题 。 一 个 小 技巧 就 是 要 每 个 人 在 回答 问题 前 投 般 子 。 如 果 
数字 6 朝 上 ， 则 回答 “是 ”， 否 则 就 吐 真言 。 这 种 方式 下 访问 者 不 会 知道 肯定 的 
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回答 是 出 于 事实 还 是 掷 出 了 6。 那么 真实 比例 该 如 何 判断 呢 ? 假设 6000 人 被 调 
查 ，3000 人 回答 “是 ”。 如 期 待 1000 人 掷 出 6， 则 1000 个 肯定 答复 是 因为 掷 骨 
子 ， 剩 下 的 2000 则 是 真 话 。 我 们 就 计算 5000 人 中 的 2000 肯定 答复 ， 预 测 比 例 
就 是 40% 。 掷 出 6 的 次 数 当然 很 少 是 整数 1000， 掷 山 子 中 的 随机 性 影响 会 反映 
在 更 大 的 边际 误差 上 ， 大 于 普通 的 民 调 。 这 种 特殊 的 民 调 从 一 开始 就 注定 六 分 之 
一 的 样本 要 被 浪费 。 

政党 们 也 自己 做 民 调 ,神奇 的 是 他 们 似乎 总 是 能 得 到 支持 自己 的 结果 。 除 了 
引入 选择 性 偏差 和 忽视 无 应 答 偏 差 .， 有 意 或 无 意 的 问题 措辞 也 可 能 引入 偏差 。 
2005 年 关于 不 幸 的 特 瑞 . 谢 维 (Terri Schiavo) 的 民 调 就 是 一 个 措 词 不 清 的 典型 
例子 。 民 调 中 ，55% 的 人 支持 特 瑞 的 丈夫 ，53% 支持 她 的 父母 ， 虽 然 双方 持 完全 
相反 的 立场 ， 但 仍 有 重合 的 地 方 。 总 而 言 之 ， 主 流 的 民 调 公司 都 会 完善 地 计划 和 
执行 民 调 ， 从 而 得 出 准确 的 结果 。 上 毕竟 民 调 公司 间 也 存在 竞争 ， 没 有 人 想 重 踊 
《文摘 》 杂 志 的 覆 入 。 

严肃 的 民 调 通过 随机 抽样 开展 ， 被 称 为 “科学 ”。 相 反 , “ 非 科 学 ”的 民 调 
就 是 人 们 被 问 到 想起 一 个 电视 节目 或 者 给 一 家 网 站 投票 。 这 种 民 调 除了 娱乐 外 几 
乎 毫 无 价值 ， 因 为 它们 本 身 存 在 选择 偏差 。 我 记得 1990 年 发 生 在 瑞典 的 一 个 非 
科学 的 民 调 例子 ， 当 时 进行 人 口 普 查 ， 和 美国 不 同 ， 瑞 典 宪 法 里 并 没有 强制 的 人 
口 普 查 内 容 ， 政 府 深入 民众 生活 要 求 他 们 填写 人 口 普查 表 的 行为 面临 重重 阻力 
(瑞典 人 很 不 能 忍受 政府 的 打扰 )。 富 有 魅力 又 风趣 的 主持 人 罗伯特 ( Robert 
Aschberg) 〈 很 难 向 非 瑞典 的 观众 描述 ) 在 晚间 脱口 秀 上 讨论 了 人 口 普 查 的 话题 ， 
当场 掏 出 人 口 普查 表 付 之 一 炬 。 同 时 ， 人 们 正 被 致电 要 求 表示 支 持 或 反对 人 口 普 
查 ， 你 瞧 ，95% 的 呼叫 者 反对 ! 显然 没有 细致 地 处 理 统计 数据 ， 不 过 这 也 很 有 意 
思 。 顺便 一 提 ， 人 口 普查 的 应 答 比 例 达 到 97.5% ， 如 果 这 是 一 次 严肃 的 政治 民 
调 ， 肯 定 会 击败 《文摘 》 创 造 历史 最 低 点 。 


| 8.4 名 校 录 取 率 与 男女 比例 


20 世纪 70 年代， 因为 在 研究 生 项 目 中 对 女性 申请 人 性 别 歧视 ， 加 州 大 学 伯 
克利 分 校 曾经 被 诉 。 诉 讼 的 证 据 是 研究 生 院 的 男女 录取 比例 数据 。 在 六 个 最 大 的 
专业 中 ，44. 5% 的 男性 申请 人 被 录取 ， 而 女性 申请 人 仅 有 30.4% 被 录取 。 因 为 
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44.5% 比 30.4% 多 一 些 ,， 原告 就 认为 这 是 一 桩 收视 案件 。 伯 克利 分 校 有 一 个 强大 
的 统计 学 专业 ， 所 以 校 领导 决定 在 案件 中 引入 统计 学 家 。 为 了 从 这 件 臭名 昭著 的 
歧视 案件 中 找 出 罪魁 祸首 的 学 院 ， 根 据 学 生 专业 对 数据 进行 分 解 。 奇 怪 的 是 ， 分 
解 后 就 再 也 找 不 出 对 女性 申请 人 歧视 的 地 方 。 事 实 上 ， 甚 至 看 起 来 女性 申请 人 在 
多 数 专业 上 更 容易 被 录取 。 这 怎么 可 能 呢 ? 

伯克利 分 校 有 超过 100 个 专业 ， 为 了 简化 ， 我 只 选用 占 比 超过 173 申请 的 六 
个 最 大 专业 的 数据 。 而 且 ， 我 将 专业 划分 为 “ 易 ”“ 难 ”两 类 ， 分 别 表 示 录 取 是 
相对 容易 还 是 困难 (不 是 指 科目 学 习 起 来 实际 上 容易 还 是 困难 )。 学 习 不 允许 院 
系 相同 ,但 是 你 可 以 想象 科学 和 工程 专业 肯定 比 文 化 人 类 学 或 比较 语言 学 拥有 更 
丰富 的 资源 以 录取 更 多 学 生 。 之 后 我 就 看 见 了 和 统计 学 家 1973 年 所 见 相同 的 模 
式 : 每 个 分 类 中 ,女性 录取 比例 更 高 ， 但 总 体 上 ， 男 性 录取 比例 更 高 。 听 起 来 很 
荡 雇 ,但 请 看 看 表 8-4 每 个 分 类 下 和 总 体 上 的 录取 学 生 数 和 申请 人 数 。 

表 8-4 两 个 专业 类 别 的 男女 录取 人 数 






































女 性 男 性 

易 录取 的 专 \ 106/133 864/1385 
难 录取 的 专 ， 451/1702 334/1306 
总 计 557/1835 1198/2691 








表 8-4 中 的 数据 不 是 很 直观 ， 让 我 们 将 数字 转化 为 比率 (百分比 ): 

表 8-5 显示 易 录 取 的 专业 中 女性 录取 比例 明显 更 高 ， 难 录取 的 专业 中 则 没有 
什么 分 别 。 然 而 ， 总 体 上 男性 申请 人 的 录取 比例 却 更 高 。 数 据 并 没有 说 谎 ， 但 是 
是 否 有 一 个 更 加 直观 有 趣 的 解释 呢 ?” 当 然 有 。 让 我 们 再 看 一 个 有 关 男 女 申请 人 选 
择 专业 的 数据 。 表 8-4 可 看 出 男性 申请 人 的 总 数 是 2691 ， 近 半 选 择 了 录取 难 的 专 
业 。 女 性 申请 人 的 情况 则 相反 ，1835 人 中 的 绝 大 多 数 ， 有 1702 人 选择 了 录取 难 
的 专业 。 表 8-6 显示 了 这 两 类 专业 男女 申请 人 的 比例 。 

表 8-5 两 个 专业 类 别 的 男女 录取 人 数 






























































女 性 男 性 
易 录取 的 专 \ 79.7% 62. 4% 
难 录取 的 专 ， 26. 5% 25. 6% 
总 计 30.4% 44. 5% 
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表 8-6 两 个 专业 类 别 的 男女 申请 比例 

















女 性 男 性 
易 录 取 的 专 ， 7.3% 51.5% 
难 录取 的 专 ) 92.7% 48.5% 











通过 最 终 的 分 析 ， 谜 底 终 于 解 天 了 。 关 键 在 于 考虑 的 不 是 录取 比例 而 是 申请 
比例 。 学 校 并 不 存在 针对 女性 的 性 别 疏 视 ， 而 是 女性 存在 自我 层 视 ， 大 量 申请 不 
均衡 地 涌 向 难 录 取 的 专业 。 如 果 女 性 申请 比例 和 男性 一 致 ， 那 么 两 个 专业 类 别 的 
录取 比例 便 会 相同 ， 有 可 能 看 起 来 女性 在 录取 过 程 中 会 更 受 青睐 。 

伯克利 录取 数据 为 辛普森 悖 论 提 供 了 一 个 典型 的 例子 ,辛普森 悖 论 是 以 统计 
学 家 辛普森 (E. H. Simpson) 命名 的 ， 他 在 1950 年 代 提出 该 理论 ,但 是 50 年 前 
苏格兰 统计 学 家 G. U. Yule 早已 有 所 讨论 2 。 专 业 的 选择 最 后 被 证 明 是 真正 的 罪 
魁 祸首 ， 被 称 为 潜在 变量 ， 除 非 你 知道 寻找 它 ， 否 则 非常 容易 被 忽略 。 伯 克利 统 
计 学 家 懂得 这 个 道理 ， 于 是 就 成 功 地 帮 学 校 摆脱 了 诉讼 。 至 于 女性 申请 人 被 录取 
难 专业 所 吸引 的 原因 则 是 另 一 个 完全 独立 的 问题 了 。 

一 个 关于 高 中 生 申 请 大 学 的 假设 示例 也 许 能 更 清楚 地 说 明 这 个 悖 论 。 假 设 学 
生 被 分 为 (学 习 能 力 )“ 强 ”“ 弱 ”两 类 ， 我 们 来 调查 看 看 每 个 类 别 的 学 生 录 取 
第 一 志愿 的 占 比 。 较 弱 的 同学 录取 第 一 志愿 的 比例 更 高 应 该 不 会 令 人 惊讶 。 结 论 
是 什么 ?难道 对 能 力 强 的 学 生 有 上 收视 ?当然 不 是 。 能 力 较 强 的 学 生 只 是 会 选择 更 
难 进入 的 学 校 ， 而 能 力 较 弱 的 同学 则 安 于 更 容易 的 选项 。 让 我 们 再 虚构 一 些 数 
字 ， 用 极端 的 情况 来 说 明 这 个 问题 。 假 设 一 所 小 规模 的 高 中 ， 毕 业 班 中 有 10 名 
较 强 的 学 生 和 90 名 较 弱 的 学 生 。 较 强 的 学 生 中 有 9 位 选择 哈佛 作为 第 一 志愿 ， 
只 有 一 名 如 愿 。 一 名 较 弱 的 同学 也 答 试 申 了 哈佛 但 没有 录取 。 所 以 较 强 同学 的 哈 
佛 录 取 比 例 是 11% ， 而 较 弱 同学 的 比例 是 0% 。 在 剩 下 的 学 生 中 ，1 名 较 强 的 同 
学 和 89 名 较 弱 的 同学 都 申请 了 本 地 的 社区 大 学 ， 除 了 9 名 较 弱 的 同学 外 都 被 录 
取 了 ， 那 么 较 强 同学 的 录取 比例 为 100% ， 较 弱 同 学 的 比例 为 90% 。 正 如 所 期 待 






























































”将 它 命名 为 “辛普森 悖 论 ” 是 施 蒂 格 勒 定律 的 一 个 典型 例子 ， 在 这 之 前 从 来 没有 一 个 科学 发 现 是 
9 名 字 命 名 的 。 另 外 一 个 例子 就 是 正 态 分 布 也 称 为 高 斯 分 布 。 随 便 提 一 下 ， 施 蒂 格 勒 定 
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的 ， 较 强 的 同学 在 两 所 大 学 都 更 容易 被 录取 ， 但 是 较 弱 同学 的 总 录取 率 高 达 
89% ， 较 强 同 学 的 录取 率 仅 有 20% 。 和 伯克利 大 学 的 女性 一 样 ， 较 强 同 学 因为 自 
身 的 选择 导致 更 难 被 录取 。 

在 伯克利 和 虚构 录取 的 例子 中 ， 将 两 种 情况 分 开 研 究 比 单 看 总 比率 要 更 有 意 
义 。 不 过 也 有 需要 反 过 来 应 用 的 情况 ， 有 关 棒 球 击 球 率 就 是 一 个 这 样 的 例子 。 比 
较 两 个 投手 ， 可 能 其 中 一 个 每 个 半 赛 季 的 击 球 率 高 ， 而 另 一 个 则 在 整个 赛季 的 击 
球 率 高 (你 可 以 自己 确认 这 种 情况 是 否 可 能 真实 发 生 )。 比 如 ， 在 上 半 赛 季 ， 选 
手 A 在 10 个 球 击 中 4 个 ,选手 B 在 40 个 球 击 中 10 个 ， 击 球 率 分 别 为 0.400 和 
0. 250。 在 下 半 赛 季 ， 选 手 A 在 40 个 球 击 中 5 个 ,选手 B 在 10 个 球 击 中 4 个 ， 
击 球 率 分 别 为 0.125 和 0. 100。 所 以 ， 选手 A 在 每 个 半 赛 季 中 都 有 更 高 的 击 球 
率 ， 但 是 就 整个 赛季 而 言 ， 选 手 A 击 球 率 为 9/50 =0. 180， 选 手 B 后 来 居 上 ， 击 
球 率 为 11/50 =0. 220。 除 非 有 一 个 好 的 理由 怀疑 上 半 赛 季 击 球 更 加 容易 或 选手 B 
更 常 轮 到 击 球 ， 可 能 更 有 意义 的 是 通 看 整个 赛季 推导 选手 B 在 两 者 中 表现 稍 佳 
( 当然 仍然 不 是 很 好 ) 。 

2000 年 选举 中 ， 乔 治 . 布什 当选 为 总 统 ， 阿 尔 . 戈 尔 却 赢 得 普选 ， 这 个 现 
象 也 和 辛普森 悖 论 相 关 。 如 果 选 举人 票 被 均匀 分 配给 直选 票 ， 阿 尔 . 戈 尔 会 得 到 
更 多 选票 。 而 现在 ， 它 们 却 被 分 配 到 各 州 ， 每 个 州 的 选举 人 数量 和 议会 议员 人 数 
(参议 院 2 位 + 众议院 人 数 ) 相同 ， 赢得 一 州 的 候选 人 会 得 到 该 州 的 全 部 选举 人 
票 。 阿 尔 . 戈 尔 虽然 在 加 利 福 尼 亚 州 和 纽约 州 获得 了 超过 一 百 万 的 选票 ， 一 个 州 
的 优势 都 是 压倒 性 的 ， 但 是 这 并 没有 帮助 戈 尔 当 选 成 功 。 最 终 ， 布 什 和 凭借 在 佛 罗 
里 达州 537 票 的 差距 赢得 了 总 统 选举 。 理 论 上 候选 人 可 以 在 大 幅度 赢得 直选 的 同 
时 只 赢得 538 票选 举人 票 中 的 3 票 ， 比 如 绝对 性 地 赢得 阿拉 斯 加 ， 其 他 各 州都 以 
微小 的 差距 失败 。 新 选 出 的 总 统 可 以 在 50 个 州 中 的 49 个 都 超过 他 的 竞争 对 手 ， 
但 全 国 范围 内 仍 是 对 手 更 受 欢迎 。 

在 一 个 更 正式 的 层面 上 ， 辛 普 森 悖 论 可 以 通过 条 件 概 率 来 表示 。 让 我 们 用 伯 
克利 录取 研究 生 的 例子 再 次 解释 ， 介 绍 有 关 随 机 选择 申请 人 的 事件 : 

A: 申请 人 被 录取 
D: 申请 人 申请 较 难 录取 的 专业 
E: 申请 人 申请 较 易 录取 的 专业 
设 女 性 申请 人 录取 概率 为 P;， 男 性 申请 人 录取 概率 为 Pj,,。 女 性 申请 人 总 的 录取 
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率 低 于 男性 的 事实 可 以 表示 为 : 
Pr(A) <Pn(A) 
考虑 专业 选择 后 ， 我 们 得 到 以 下 条 件 概率 的 关系 : 
P(A|D) >Py( A|D) 





和 
P(A|E) >Py(AlE) 
上 述 都 说 明了 每 个 分 类 中 女性 录取 率 更 高 ， 运 用 全 概率 定律 ， 女 性 总 的 概率 是 
Pi(A) =Pi(AID) xP;(D) +Pi(A|E) xPi(E) 
而 对 男性 来 说 
Py(A)=Py(AID) xPy,(D) +Py(AIE) xPy(E) 
这 个 悖 论 的 解 就 在 P,(D)， P(E)，Py(D)，Py(E) 中 ,描述 了 男性 和 女性 如 
何 选 择 专业 。 
我 们 也 可 以 将 辛普森 悖 论 在 严格 意义 上 用 公式 表达 为 一 个 数学 问题 ， 让 它 迷 
一 般 的 魅力 消散 。 这 个 问题 是 ， 是 否 可 能 找到 0 ~1 之 间 的 数字 4A, a, B, b, p， 
gg， 满足 即使 当 p x4+(1-p)xB<gxa+(1-g) xb 时 , 仍 有 
A>a, B>0b 
这 里 没 任何 问题 ， 只 要 让 4 >a >B >5b， 再 选择 足够 接近 0 的 p 和 足够 接近 1 
的 94， 就 可 保持 上 述 不 等 式 成 立 。 问 问 你 的 数学 家 朋友 这 个 问题 ， 再 问 他 们 是 否 相 
信 女 性 在 两 个 专业 分 类 中 都 有 更 高 录取 率 的 同时 总 的 录取 率 却 更 低 。 虽 然 同 一 个 问题 
有 很 多 种 表述 法 ， 但 如 果 得 到 的 回答 是 “当然 ”或 者 “不 可 能 ”， 倒 不 会 让 我 停 讶 。 





























8.5 优生 学 与 喷 录 间歇 喷发 














在 6. 2 节 中 我 曾 提 及 弗朗西斯 . 高 尔 顿 副 士 和 他 的 担心 ， 卓 越 的 特性 趋向 于 
在 杰出 人 士 的 后 代 中 消失 。 我 们 现在 仔细 审视 高 尔 顿 加 士 曾 分 析 过 的 数据 类 型 和 
从 观测 对 象 中 所 观测 到 的 值 ， 即 我 早先 提 到 的 父子 身高 问题 2 。 假 设 你 测量 大 量 

















”弗朗西斯 一 士 第 一 次 观测 到 这 个 现象 实际 是 花园 里 统 豆 的 尺寸 ， 但 园艺 上 的 卓越 性 在 多 大 程度 导 
致 他 失眠 尚 不 清楚 。 在 人 类 的 问题 上 ， 高 尔 顿 除了 身高 外 还 量 了 很 多 数值 ， 比 如 室内 服装 的 重 
量 、 马 箭 手 弯 腰 时 拉 伸 的 长 度 和 打击 的 速度 。 






































父子 的 身高 ， 得 到 多 组 高 度 (x，y) ，x* 表示 父亲 的 身高 ，y 表示 儿子 的 身高 (如 
果 家 庭 里 有 多 个 儿子 ， 那 么 每 组 高 度 x 保持 不 变 ， 只 y 变化 ) 。 简 而 言 之 ， 高 尔 
顿 观 测 到 的 是 父亲 越 高 ， 儿 子 也 越 高 ， 但 却 并 非 完美 相 关 。 儿 子 的 身高 经 过 个 体 
变异 ,平均 上 趋向 处 于 父 非 身高 和 总 人 口 平均 身高 之 间 。 因 为 高 尔 顿 对 卓越 特性 
充满 兴趣 ， 而 显然 就 他 们 之 间 的 高 度 计算 ， 他 注意 到 后 代 中 特定 的 特性 会 渐渐 不 
太 显 著 ， 在 代 传 递 间 “ 趋 中 回归 ”。 继 续 以 上 思路 似乎 会 得 出 这 样 一 个 结论 ， 即 
全 人 类 最 后 身高 会 恢复 平均 ， 但 在 现实 中 这 并 未 发 生 ， 因 为 还 有 很 多 随机 变异 3 
抵消 回归 效应 。 

让 我 们 看 看 高 尔 顿 收集 的 数据 类 型 。 在 图 8-1 中 所 示 为 500 组 父子 里 高 观 
测 值 ， 实 线 表示 回归 线 ， 虚 线 表 示 对 角 线 。 这 些 不 是 高 尔 顿 的 原始 数据 ， 而 是 
作者 用 计算 机 生成 的 。 不 过 ， 它 们 相对 于 高 尔 顿 所 观测 到 的 同样 具有 代表 性 。 
父 代 的 身高 都 在 x 轴 上 ( 横 轴 ) ， 子 代 的 身高 则 在 y 轴 上 。 父 子平 均 身 高 为 68 
英寸 ,在 密布 点 的 中 间 位 置 。 注 意 密布 点 是 如 何 向 右上 方 倾斜 的 ， 这 表示 高 
个 父 代 的 子 代 通常 也 很 高 。 虽 然 并 非 完 美 相关 ， 但 你 看 比 平 均值 稍 高 的 72 
英寸 附近 的 父 代 身高 ， 会 注意 到 对 应 的 子 代 身高 分 布 在 68 英寸 和 74 英寸 
之 间 。 
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图 8-1 500 组 父子 身高 观测 值 
x 轴 为 父 代 的 身高 ，y 轴 为 子 代 的 身高 ， 回 归 线 为 实 线 ， 对 角 线 为 虚线 


令 高 尔 顿 担心 的 一 点 是 ， 如 图 8-1 左 图 所 观测 的 ， 一 条 斜 对 角 的 虚线 贯穿 密 
布点 。 观 察 身高 在 72 英寸 到 74 英寸 的 父 代 ， 你 会 发 现 他 们 子 代 的 号 高 几乎 全 部 
都 在 该 线 之 下 。 因 此 ， 这 些 非常 高 的 父亲 生 下 的 子 春 通常 都 比 自己 矮 ， 确 实 很 令 
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人 失望 。 而 在 图 的 另 一 端 ， 父 代 身 高 低 于 平均 值 时 ， 相 反 ， 子 辈 的 身高 几乎 都 在 
该 线 之 上 ， 不 过 高 尔 顿 似 乎 没有 从 中 得 到 任何 安奈 。 无 论 如 何 ， 最 后 证 明 能 画 出 
另 一 条 线 以 更 好 地 描述 到 底 发 生 了 什么 。 这 条 线 又 称 为 回归 线 ( 右 图 中 的 实 
线 ) ， 表 示 给 定 父 代 身高 所 对 应 的 子 代 平均 身高 。 在 图 8-1 右 图 中 ， 密 布点 再 
次 与 虚线 和 回归 线 一 同 显示 。 注 意 回归 线 不 同 于 虚线 ， 在 它 的 垂直 高 度 中 ， 点 
的 上 下 分 布 数量 大 致 相同 。 任 何 给 定 的 父辈 身高 ， 子 辈 的 平均 身高 都 可 计算 。 
比如 ， 若 父 代 身高 72 英寸 ， 子 辈 平 均 身 高 为 70. 8 基 寸 ， 低 于 父辈 身高 但 高 于 
总 人 口 的 平均 身高 。 在 本 书 中 研究 回归 线 的 公式 有 点 过 于 技术 化 了 ， 但 数学 计 
算 软件 如 MATLAB 和 有 统计 图 形 功能 的 随身 计算 器 都 可 以 在 瞬间 帮 你 画 出 回 
归 线 。 

因此 高 尔 顿 所 观测 到 的 现象 非常 正常 ， 不 会 导致 身高 的 单 值 化 ， 即 一 群 人 中 
每 个 人 的 身高 都 是 68 英寸 。 事 实 上 ， 父 子 的 身高 分 布 其 实 非常 相似 ， 都 聚集 在 
68 英寸 的 平均 刁 高 附近 ， 也 具有 相同 的 变异 性 (标准 差 同 为 2.5)。 高 的 人 通常 
有 高 于 平均 身高 的 子 非 们 ,偶尔 身高 为 平均 身高 或 者 更 矮 的 人 也 会 有 高 的 子 辈 。 
正如 我 首次 遇 到 趋 均 数 回归 时 所 提 到 的 连续 掷 骨 子 问题 ， 掷 出 6 后 ， 下 一 轮 你 会 
期 望 掷 出 较 低 的 点 数 ;， 而 掷 出 1 后 就 会 期 望 较 高 的 点 数 ， 但 是 你 不 会 期 望 一 直 掷 
出 3 或 4。 父 子 身 高 问题 和 掷 骨 子 问题 之 间 的 类 比 多 少 有 些 不 可 靠 ， 因 为 子 辈 的 
身高 取决 于 父辈 ， 但 连续 掷 货 子 完 全 是 彼此 独立 的 。 不 过 ， 在 这 两 个 示例 中 确实 
都 能 观测 到 趋 均 数 回归 的 现象 。 

趋 均 数 回归 在 各 种 情况 下 都 会 出 现 ， 其 中 一 个 典型 的 例子 是 考试 分 数 。 假 设 
卡 罗 参 加 了 两 场 同 等 难度 的 考试 ， 作 为 一 个 好 学 生 ， 她 期 望 每 场 都 得 到 80% 的 
分 数 。 如 果 第 一 场 她 的 得 分 低 于 80% ， 那 么 第 二 场 分 数 就 可 能 提高 。 相 反 ， 如 
果 第 一 场 高 于 80% ， 第 二 场 分 数 就 可 能 低 些 。 如 果 她 有 洱 在 第 一 场 考 得 非常 糖 ， 
第 二 场 的 表现 就 可 能 有 非常 大 的 提高 ! 与 此 相反 ， 那 些 在 第 一 场 表现 非常 好 的 可 
怜 家 伙 ， 第 二 场 分 数 就 可 能 下 降 。 正 如 我 所 指出 的 ， 我们 人 类 有 一 种 即使 完全 不 
需要 也 要 寻找 解释 的 倾向 。 如 果 卡 罗 在 两 场 考试 间 喝 了 许多 咖啡 ， 就 可 以 完美 解 
释 分 数 提高 的 原因 。 

如 果 像 美国 有 些 州 一 样 ， 学 校 会 因 改 进而 受到 奖励 ， 趋 均 数 回归 告诉 我 们 ， 
表现 较 差 的 学 校 开 始 局 面 会 更 好 ， 它 们 会 比 好 学 校 更 容易 受到 奖励 。 体 育 、 医 
药 和 其 他 领域 也 会 出 现 相 同 的 现象 ， 起 点 低 就 更 容易 提高 ， 反 之 亦 然 。 棒 球 界 
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一 个 广为人知 的 现象 是 年 度 新 秀 第 二 年 (又 称 “ 二 年 级 生 症 候 群 ") 的 击 球 率 
一 般 会 下 降 ， 趋 均 数 回归 很 好 地 解释 了 这 个 现象 。 新 秀 年 的 击 球 率 异乎 寻常 的 
高 ， 这 种 偏差 使 他 成 为 年 度 新 秀 ， 但 下 一 赛季 中 成 功 不 太 可 能 得 到 复制 。 我 们 
要 在 这 里 学 到 的 是 ,分 清 实际 变动 和 导致 趋 均 数 回归 的 完全 正常 波动 两 者 很 
重要 。 

在 现代 统计 学 中 ， 高 尔 顿 提 出 的 回归 的 概念 ， 即 “向 后 发 展 ”， 已 经 弃 之 不 
用 , 但 “回归 ”这 个 词 却 保留 下 来 。 目 前 ， 两 组 以 上 变量 间 的 任何 关系 都 可 用 
回归 来 相 容 。 最 简单 的 形式 是 线性 回归 ， 即 如 之 前 所 做 ， 用 一 条 直线 来 拟 合 数据 
集 ， 不 过 还 有 很 多 种 回归 形态 ， 如 二 次 的 ， 三 次 的 ， 对 数 的 ， 符 号 逻辑 的 ， 倍 数 
的 ， 用 以 描述 拟 合 数据 的 各 种 不 同类 型 的 曲线 和 函数 。 

当 高 尔 顿 收集 数据 发 现 回 归 现象 时 ， 还 调查 了 后 世 著名 的 相关 性 ， 用 来 度量 
两 个 变量 间 的 关联 程度 。 简 单 地 说 ， 两 个 变量 被 称 为 相关 是 指 一 个 的 值 可 被 用 于 
预测 另 一 个 值 。 上 述 父子 身高 就 是 一 个 例子 ， 如 已 知 父 代 的 身高 ， 即 可 预测 子 代 
的 平均 身高 ， 我 们 看 见 的 图 8-1 也 说 明了 他 们 之 间 的 关系 。 两 个 变量 不 必要 属 同 
一 类 型 。 图 8-2 所 示 为 2006 年 明尼苏达 维 京 人 队 选 手 的 身高 和 体重 ， 正 如 所 期 
待 的 ， 两 者 存在 明显 的 相关 关系 。 你 既然 已 经 了 解 回 归 线 的 含义 ， 我 也 把 这 条 线 
画 出 来 。 注 意 密 布点 在 水 平方 向 和 垂直 方向 上 如 何 分 布 ， 因 为 体重 和 身高 分 别 用 
整数 英寸 表示 ， 所 以 很 多 选手 体重 相同 ， 也 有 很 多 选手 身高 相同 。 如 果 是 更 精确 
地 度量 ， 我 们 就 看 不 到 这 些 线 了 。 

可 能 更 有 趣 的 例子 是 $. 4 节 中 提 到 的 老 忠实 泉 。 当 你 在 黄石 国家 公园 参观 这 
座 宏伟 的 间歇 泉 时 ， 你 会 发 现下 一 次 喷发 的 预测 时 间 张 贴 在 游客 中 心 。 该 预测 基 
于 观测 到 的 喷发 时 间 长 度 和 连续 喷发 间隔 期 的 相关 性 得 出 ， 喷 发 时 间 长 ， 相 应 地 
喷发 间隔 也 更 长 。 这 是 有 道理 的 ， 因 为 长 期 的 喷发 需要 更 多 的 热 和 水 ， 意 味 着 需 
要 更 多 的 时 间 储 备 新 一 轮 喷发 的 压力 。 因 此 ， 一 旦 喷发 结束 ， 它 的 喷发 时 间 被 记 
录 下 来 ， 数 值 输入 回归 线 的 公式 中 ， 计 算出 下 次 喷发 的 时 间 。 大 量 其 他 的 因素 也 
会 影响 间隔 时 间 ， 所 以 相关 性 并 非 完美 ,但 很 明确 。 图 8-3 中 显示 了 20 种 喷发 
长 度 和 间歇 时 间 的 组 合 关系 ， 以 及 建立 在 这 些 数值 上 的 回归 线 。 老 忠实 泉 或 许 是 
全 世界 被 人 研究 最 多 的 间歇 泉 ， 数 十 年 来 一 直 收 集 数 据 ， 数 不 胜 数 的 观测 记录 被 用 
于 预测 。 我 仅 采 用 了 这 20 组 观察 记录 ,来 阐明 这 些 预 99 测 所 基于 的 相关 关系 
类 型 。 
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相关 性 可 以 用 相关 系数 量化 ,在 数字 -1 到 1 间 变 化 。 相 关系 数 接近 0 表示 

变量 间 不 存在 线性 相关 ， 而 接近 -1 和 1 的 相关 系数 表示 强烈 相关 。 有 一 个 公式 

用 于 从 一 组 观测 数据 中 计算 相关 系数 ， 但 是 因为 公式 有 点 复杂 ， 对 理解 相关 性 没 

什么 帮助 ， 我 选择 暂 不 讨论 它 。 在 父子 数据 和 橄 槛 球 队 选 手数 据 中 ， 相 关系 数 大 

约 为 0.7， 而 老 忠实 泉 的 大 约 为 。 体重 儿 

0.8， 是 非常 高 的 相关 性 (这 很 。 5|.. 

容易 理解 ) 。 当 回归 线 斜 向 上 时 ， 

我 们 就 说 呈正 相关 。 相 关系 数 负 

值 则 意味 着 回归 线 斜 向 下 ， 即 一 

个 变量 的 高 值 相对 应 的 是 另 一 个 

变量 的 低 值 ， 我 们 称 它 为 负 相关 。 175 

(比如 血压 和 预期 寿命 的 例子 ) 。 1 10 20 30 自 期 /日 
若 变 量 间 的 相关 系数 为 0， 图 8-4 明尼苏达 维 京 人 队 队 员 的 生日 和 体重 

我 们 就 说 变量 不 相关 。 图 8-4 所 

示 为 明尼苏达 维 京 人 队 队 员 的 生日 和 体重 。 密 布点 间 并 无 可 识别 的 模式 ， 当 然 本 

来 也 不 应 该 有 。 生 日 和 体重 是 不 相关 的 变量 。 实 际 些 的 评论 是 ， 由 不 相关 变量 组 

成 的 数据 集中 算出 的 相关 系数 几乎 不 可 能 刚好 是 0， 但 除非 相关 系数 离 0 稍 远 ， 

否则 也 不 能 得 出 变量 间 相 关 的 结论 (就 像 民 调 中 我 们 还 需要 考虑 边际 误差 一 样 ) 。 
相关 性 完美 地 诠释 了 高 尔 顿 的 建议 ,统计 必须 被 “巧妙 处 理 "”“ 并 慎 解 

释 ”。 一 个 常见 的 错误 是 混淆 相 关 性 和 因果 关系 ， 以 为 两 个 变量 相关 必然 的 结 
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是 前 者 导致 了 后 者 。 有 时 见于 统计 学 文献 中 廖 论 的 一 个 可 笑 例 子 就 是 认为 被 派 去 
火灾 现场 的 消防 员 数 量 和 经 济 损失 规模 呈正 相关 。 推 论 是 什么 呢 ? 是 不 是 说 如 果 
你 的 房子 着 火 了 ， 你 不 打 电 话 叫 消 防 员 来 灭火 就 能 减少 经 济 损失 了 ? 这 两 者 之 间 
没有 因果 关系 ， 只 是 一 个 潜在 变量 一 一 火势 大 小 造成 了 这 种 相关 性 。 火 情 越 大 现 
场 就 需要 更 多 的 消防 员 ， 带 来 的 经 济 损失 也 就 越 大 。 这 跟前 一 节 中 介绍 的 伯克利 
大 学 录取 数据 是 同样 的 原理 。 在 录取 数据 的 例子 中 我 们 可 以 发 现 性 别 与 录取 率 之 
间 的 相关 性 ， 而 这 个 例子 中 潜在 变量 是 间接 的 而 不 是 根本 的 。 性 别 影 响 了 专业 的 
选择 ， 反 过 来 这 种 选择 又 会 影响 录取 的 概率 。 

现实 中 有 许多 伪 相 关 性 的 例子 。 比 如 许多 美国 的 家 庭 购买 冰激凌 的 钱 与 电费 
呈正 相关 。 难 道 是 冰 激 次 越 多 冰箱 越 耗 电 吗 ? 还 是 说 越 来 越 高 的 电费 让 大 家 的 经 
济 压力 变 大 ， 所 以 不 得 不 多 吃 些 冰 激 凌 来 寻求 安奈 ? 可 能 不 是 吧 。 这 个 例子 中 的 
潜在 变量 是 一 一 和 夏天。 天 气 越 热 空调 温度 就 要 开 得 越 低 ， 需 要 吃 更 多 的 冰激凌 。 
同时 夏天 供暖 的 需求 越 小 煤气 费用 支出 就 越 小 ， 所 以 这 就 与 购买 冰激凌 的 支出 形 
成 了 负 相 关 的 联系 。 这 些 例子 中 的 相关 性 都 有 合理 的 逻辑 解释 ， 但 是 并 不 是 所 有 
的 相关 性 都 能 有 合理 的 解释 。 随 着 你 夏天 冰激凌 的 文 出 越 来 越 高 ， 就 会 出 现 另 外 
一 些 事情 的 增长 或 下 降 。 也 许 某 一 年 道 芒 斯 股票 指数 在 上 升 或 者 是 纽约 扬 基 队 比 
赛 获胜 的 数量 下 降 ， 这 些 事情 都 与 你 买 Ben 和 Jerry 冰激凌 的 数量 有 着 神秘 的 
关系 。 



































8.6 ”数据 探测 法 


我 曾经 说 过 统计 学 是 被 量化 的 常识 ， 将 量化 与 常识 结合 在 一 起 非常 重要 。 比 
如 某 种 疾病 不 药 而 愈 的 概率 是 80% ， 现 在 一 百 个 病人 吃 完 某 种 药 之 后 治愈 的 概 
率 是 90%， 那 么 我 们 能 说 这 种 药 提 高 了 治愈 率 吗 ? 

就 像 民意 调查 一 样 ， 我 们 将 这 一 百 个 病人 当做 所 有 可 能 得 病 的 人 的 代表 样 
本 。 所 以 仅仅 因为 90 比 80 大 就 说 提高 了 治愈 率 是 不 够 的 。 因 为 在 80% 的 期 望 治 
愈 率 周 于 存在 随机 变化 的 可 能 。 假 设 有 82 个 病人 痊愈 了 ， 这 个 数字 非常 接近 80。 
所 以 我 们 会 认为 这 个 变化 是 自然 的 ， 而 不 把 它 归 因为 药物 的 作用 。 当 这 个 数字 提 
高 到 90 呢 ? 这 还 是 处 于 自然 变化 的 范围 之 内 吗 ? 如 果 我 们 假设 药物 没有 发 生 作 
用 ，100 个 人 中 90 个 人 甚至 更 多 的 人 痊愈 的 概率 只 有 0.002。 这 个 概率 非常 的 
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小 ， 但 是 我 们 的 确 会 觉得 这 个 提高 是 由 药物 引起 的 。 但 是 通过 量化 这 个 风险 ， 我 
们 知道 这 个 结论 是 错误 的 。 每 一 千 个 案例 中 有 两 种 情况 下 即使 药物 不 发 挥 作 用 我 
们 还 是 能 看 到 一 个 显著 的 提升 。 这 个 数字 已 经 充分 说 明了 药物 所 发 挥 的 作用 ， 但 
因为 有 这 个 药物 的 试验 ， 我们 的 常识 却 还 在 告诉 我 们 相反 的 结论 。 如 果 病 人 们 是 
通过 吃 糖 和 香草 按摩 从 而 提高 了 治愈 率 ， 那 么 我 们 就 不 会 得 到 类 似 的 结论 了 。 这 
种 结论 就 是 在 现象 与 之 前 场景 之 间 建 立 了 伪 相 关 性 。 这 也 说 明了 要 得 到 一 个 有 意 
义 的 结论 必须 基于 大 量 的 数据 和 理论 知识 。 

下 面 我 们 来 介绍 一 个 严重 滥用 统计 数据 的 例子 。 我 登录 德 克 萨 斯 州 彩票 网 
站 ,看 到 了 “ 选 3” 游 戏 (在 0 ~9 之 间 选 择 三 个 数字 ) 对 应 的 数字 出 现 频率 。 
在 过 去 五 年 中 白天 开奖 一 共 开 出 了 3822 个 幸运 号 码 ， 所 以 我 们 可 以 合理 推测 
0 ~9 之 间 的 每 个 数字 都 大 概 出 现 了 382 次 。 当 然 不 可 能 每 个 数字 都 恰好 出 现 382 
次 ， 我 们 必须 允许 随机 变化 的 存在 ， 有 些 数字 就 出 现 了 366 次 ， 男 一 些 数字 则 出 
现 了 390 次 的 情况 是 非常 正常 的 。 但 是 我 注意 到 数字 3 只 出 现 过 345 次 ， 这 个 数 
据 实在 过 低 。 通 过 计算 发 现 这 种 情况 对 应 的 概率 只 有 2. 3% 。 如 果 这 是 一 个 民意 
调查 的 话 ， 它 就 意味 着 在 3822 个 调查 对 象 中 有 345 人 表达 了 对 候选 人 的 支持 。 
正常 的 误差 幅度 不 足以 解释 这 个 问题 ， 所 以 此 时 我 们 可 以 说 这 个 偏差 在 统计 上 非 
常 显著 。 那 我 们 需要 去 探究 为 什么 数字 3 出 现 的 次 数 这 么 少 吗 ? 

完全 没有 必要 。 这 是 典型 的 数据 探测 法 ， 当 你 发 现实 际 情况 与 理论 数据 不 
符 ， 然 后 用 计算 的 数据 来 证 明 这 些 异常 的 不 符 现象 是 正常 的 。 这 有 什么 问题 吗 ? 
你 很 可 能 会 发 现 有 些 东西 是 错 的 (统计 学 家 们 会 戏称 ， 如 果 你 长 期 折磨 这 些 数 
字 ， 它 们 最 终 就 会 坦白 ) 。 在 德 克 萨 斯 州 彩 票数 据 的 例子 中 ， 我 们 计算 出 数字 3 
对 应 的 概率 只 有 约 2% ， 但 是 这 并 不 是 相关 的 。 因 为 在 这 种 情况 下 有 一 些 其 他 的 
数字 很 可 能 占 的 比例 超过 平均 数 。 我 继续 观察 了 夜间 开奖 的 数字 ， 其 中 数字 6 出 
现 的 概率 比 正 常 的 概率 超出 了 2.5% 。 总 是 有 一 些 数字 的 偏差 会 比较 大 ， 这 是 再 
正常 不 过 的 。 不 要 把 我 们 的 常识 抛 在 一 边 ; 除非 你 是 个 偏执 的 数学 命理 学 家 ， 否 
则 你 完全 没有 必要 去 说 明 为 什么 数字 3 出 现 的 次 数 会 这 人 么 少 。 如 果 有 人 真 的 拿 出 
理论 统计 证 据 (尤其 是 只 提供 了 统计 证 据 时 ) 给 出 了 所 谓 的 解释 ， 你 也 要 保持 
一 种 怀疑 的 态度 。 

对 于 彩票 数据 有 一 种 快捷 方便 的 检测 方法 一 一 卡 方 检验 法 ， 用 这 种 方法 就 能 
检测 出 幸运 号 码 是 不 是 随机 抽 中 的 。 这 种 方法 的 核心 思想 就 是 计算 这 个 数 与 预期 
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随机 数 的 偏差 。 如 果 这 个 数 太 大 了 (这 里 的 “ 太 大 ”是 指 用 概率 量化 之 后 的 结 
果 ) ， 那 么 我 们 就 可 以 得 出 抽奖 程序 有 问题 的 结论 ， 这 些 数字 就 不 是 随机 抽取 的 。 
表 8-7 列 出 了 数字 0 ~9 对 应 的 观察 到 的 频率 和 预期 频率 。 这 两 者 之 间 的 偏差 是 
正常 的 吗 ? 还 是 说 抽奖 程序 有 瑕 辛 ? 

表 8-7 德 克 萨 斯 州 “ 选 3” 游 戏 中 数字 0~9 对 应 的 观察 到 的 频率 和 预期 频率 

数 字 0 1 2 3 4 5 6 7 8 9 





观察 到 频率 | 366 382 377 345 386 390 371 412 419 374 
预期 频率 | 382 | 382 382 382 382 382 382 382 382 382 



































差 额 一 16 0 -5 -37 4 8 -9 30 37 —8 


卡 方 检验 法 首先 把 观察 到 的 频率 和 预期 频率 之 间 的 差 进 行 平方 ， 然 后 再 将 这 
个 平方 数 除 以 预期 的 频率 ， 最 后 把 所 有 计算 出 来 的 商 相 加 。 如 果 最 终 的 结果 很 
大 ， 就 表示 观察 到 的 频率 和 预期 频率 之 间 的 偏差 很 大 。 我 在 此 不 想 解 释 这 种 方法 
的 原理 ,但 你 应 该 明白 为 什么 要 用 到 平方 数 。 因 为 观察 到 的 频率 和 预期 频率 之 间 
的 差 可 能 是 正 数 也 可 能 是 负数 ， 如 果 不 进行 平方 的 话 它 们 就 会 相互 抵消 。 而 用 这 
些 平方 数 去 除 以 预期 数 的 原因 就 在 于 得 出 的 商 越 大 随机 变量 就 越 随 机 。 卡 方 检验 
法 通常 用 x 来 表示 ， 在 这 个 例子 中 我 们 可 以 得 到 如 下 式 子 : 

xX =(366 -382)2/382 + (382 -382)’”/382 +:… + (374 -382)’/382~=10.95 
现在 我 们 必须 判断 这 个 数字 是 一 个 大 数字 还 是 小 数字 。 首 先 我 们 可 以 将 这 个 数字 
与 期 望 值 来 做 个 比较 。 期 望 值 等 于 种 类 数 减 去 1， 具 体 到 数字 0 ~9 共有 十 类 ， 所 
以 期 望 值 为 9。 而 我 们 通过 观察 计算 得 到 的 值 是 10.95， 两 者 之 间 相 差 不 大 。 而 
且 标 准 差 等 于 两 倍 期 望 值 的 平方 根 ， 即 V18 =4. 24。 鉴 于 10. 95 与 期 望 值 的 差 比 
标准 差 小 ， 所 以 我 们 观察 到 的 频率 一 点 也 不 极端 。 我 们 还 通过 计算 概率 量化 得 到 
XX 来 判断 出 这 组 数字 是 随机 抽取 的 数字 。 借 助 于 MATLAB ， 我 们 计算 出 这 个 概率 
是 28%。 这 不 是 小 概率 ， 所 以 我 们 观察 到 的 x = 10. 95 不 是 一 个 异乎 寻常 的 大 
数 。 因 此 我 们 可 以 得 出 结论 : 偏差 很 正常 ， 抽 取 数 字 的 随机 性 毋庸 置疑 。 这 个 结 
论 是 在 整个 数据 的 基础 上 得 出 的 ， 而 关于 数字 3 的 结论 则 仅仅 是 把 它 单 挑 出 来 计 
算 而 得 的 。 在 这 个 例子 中 使 用 卡 方 检验 法 是 非常 恰当 的 。 

这 个 彩票 的 例子 也 说 明了 一 个 问题 ， 当 你 的 观察 对 象 有 多 个 类 别 时 ， 你 可 能 
会 发 现 其 中 的 一 两 个 数字 的 偏差 比 期 望 偏差 要 大 。 但 是 如 果 运 用 了 卡 方 检 验 法 检 
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验 之 后 发 现 并 没有 什么 异常 的 情况 ， 则 没有 必要 立刻 去 关注 这 些 个 别 类 别 的 偏 
差 。 还 有 一 个 典型 的 例子 就 是 美国 的 50 个 州 。 假 设 现 在 要 考虑 某 些 不 按照 特定 
区 域 分 布 的 疾病 或 者 死亡 原因 ， 你 也 可 能 会 发 现 某 一 些 州 的 数据 对 应 的 偏差 要 比 
正常 的 偏差 大 很 多 。 当 你 开始 埋头 要 找 原 因 时 你 最 好 还 是 先 用 卡 方 检验 法 来 整体 
检查 一 下 吧 。 

不 论 你 是 有 目的 地 去 使 用 还 是 偶然 使 用 ， 数 据 探测 法 是 一 个 严肃 的 问题 。 数 
字 本 身 是 不 会 撒谎 的 ， 但 是 它们 可 能 无 意识 地 就 符合 了 某 种 特定 的 假设 ， 这 种 情 
况 就 很 难 被 发 现 。 有 些 时 候 我 们 得 出 来 的 结论 是 说 不 通 的， 但 是 我 们 可 能 就 会 怀 
疑 这 些 数 据 有 问题 ， 然 后 开始 分 析 这 些 数 据 。 瑞 典 统 计 学 家 霍 尔 格 . 洛 特 森 
( Holger Rootzen) 曾经 告诉 我 他 在 分 析 保 险 公 司 的 事故 索赔 数据 时 发 现 一 个 怪异 
之 处 ， 最 近 一 次 的 索赔 总 是 最 高 额 的 。 这 到 底 是 怎么 回 事 呢 ? 是 事故 越 来 越 严 重 
了 吗 ? 答案 其 实 平淡 无 奇 ， 当 一 个 保险 公司 经 历 了 不 寻常 的 赔偿 额 支出 之 后 ， 它 
们 开始 寻求 统计 学 家 们 的 帮助 。 所 以 当 统 计 学 家 们 拿 到 这 些 数据 时 ， 最 近 一 次 的 
索赔 显然 就 是 最 高 额 的 。 虽 然 可 以 把 这 个 现象 部 分 归 因 为 突然 增加 的 赔偿 数量 ， 
但 是 这 样 的 分 析 就 会 回避 了 真正 的 原因 。 

几 年 前 我 看 过 一 篇 统计 学 研究 ， 人 研究 宣称 银色 的 车 发 生 事 故 的 概率 比 其 他 颜 
色 的 车 要 小 。 文 章 的 作者 并 没有 提供 任何 逻辑 的 解释 ， 只 是 用 统计 数据 来 说 明 问 
题 ， 最 后 他 们 还 建议 工厂 生产 更 多 银色 的 汽车 来 提高 安全 性 。 我 绞 尽 脑汁 也 想 不 
出 任何 理由 来 支持 他 们 研究 中 的 发 现 ， 因 为 任何 其 他 的 研究 可 以 宣称 红色 或 是 蓝 
色 的 车 发 生 事故 的 概率 比较 小 。 这 就 像 是 德 克 萨 斯 州 彩票 例子 中 出 现 的 问题 一 
样 ， 单 个 的 数据 可 能 会 显得 不 太 正常 ， 但 是 整体 考虑 时 就 完全 没有 什么 异常 之 
人 处。 在 汽车 的 例子 中 也 许 会 有 一 些 合理 的 解释 ， 比 如 谨慎 的 司机 偏爱 买 银色 的 
车 。 如 果 是 这 种 理由 的 话 ， 作 者 们 要 求 多 生产 银色 车 的 建议 就 变 得 毫 无 意义 了 。 
如 果 没 有 合理 的 解释 ， 我 们 就 还 是 对 这 些 结论 保持 谨慎 的 怀疑 态度 吧 。 把 这 篇 研 
究 当 成 是 一 个 统计 学 上 的 笑话 大 概 就 是 最 好 的 解释 。 

数据 探测 法 的 另 一 个 经 典 的 用 途 就 是 遗传 基因 学 。 现 代 遗 传 学 之 父 一 一 格 里 
哥 . 孟 德 尔 (Gregor Mendel) (1822 一 1884) 跟 高 尔 顿 一 样 与 菜园 里 的 驶 豆 有 不 解 
之 缘 。 不 同 的 是 高 尔 顿 通过 这 些 静 豆 联 想到 了 优越 性 的 丧失 ， 而 备 德 尔 却 有 更 加 
伟大 的 发 现 。 他 第 一 个 发 现 个 体 的 特征 会 作为 一 个 独立 的 单位 从 父辈 传 给 子孙 后 
代 , 不 与 其 他 的 特征 混合 。 他 有 一 个 著名 的 试验 就 是 将 两 种 不 同 种 类 的 纹 豆 ( 圆 
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粒 与 皱 粒 ) 进行 杂交 ， 此 时 所 有 杂交 的 骂 豆 都 是 圆 粒 的 ， 他 又 把 杂交 之 后 的 玖 豆 
继续 杂交 ， 此 时 结 出 的 琉 豆 中 25% 是 皱 粒 的 ，75% 是 圆 粒 的 。 由 此 他 发 现 了 显 性 
基因 和 隐 性 基因 。 皱 粒 的 豌豆 是 隐 性 的 ， 所 以 需要 两 个 因子 才 可 以 显现 出 特征 ; 
而 圆 粒 意 豆 的 基因 是 显 性 基因 ， 只 需要 一 个 因子 就 可 以 表现 出 特征 。 如 果 父 辈 植 
物 进行 杂交 ， 每 个 遗传 基因 携带 一 个 特征 那么 杂交 植物 必然 都 是 圆 粒 的 ; 但 如 果 
继续 杂交 则 结果 有 可 能 是 圆 粒 的 ， 也 有 可 能 是 皱 粒 的 。 把 这 些 遗 传 基因 写作 S 和 
叉 〈 译 者 注 :“ 圆 粒 ” 英 文 为 smooth, “人 皱 粒 ”英文 为 wrinkled) ， 那 么 父辈 植物 
的 为 SW。 父 系 和 母系 分 别 随 机 遗传 一 个 基因 给 杂交 出 来 的 植物 ， 所 以 杂交 植物 
遗传 到 两 个 W 变 成 皱 粒 豌豆 的 概率 为 25% 。 剩 下 的 75% 的 怠 豆 至 少 会 有 一 个 S 
基因 ， 所 以 它们 都 是 圆 粒 的 。 如 果 这 些 圆 粒 纹 豆 是 SW， 那 么 它们 本 身 也 像 父 辈 
植物 那样 携带 着 隐形 的 基因 。 从 这 个 角度 上 来 看 ， 遗 传 学 是 一 门 大 量 运 用 概率 学 
和 统计 学 知识 的 科学 。 

证 我 们 再 次 回 到 和 孟 德 尔 的 例子 。 他 曾经 做 过 一 组 实验 ， 共 有 7324 颗 怠 豆 ， 
其 中 5474 颗 是 圆 粒 葛 豆 ，1850 颗 是 皱 粒 恼 豆 。 按 照 随机 交配 的 假设 ， 圆 粒 豌豆 
应 当 占 7324 颗 吏 豆 的 75% ， 即 5493 颗 ; 而 皱 粒 玖 豆 应 当 为 1831 颗 。 孟 德尔 实 
验 的 数据 实在 太 完美 了 。 就 像 有 的 时 候 观察 到 的 数据 离 期 望 值 太 远 一 样 ， 有 的 时 
候 这 些 数据 会 太 接近 期 望 值 。 在 这 个 例子 中 我 们 都 认同 孟 德 尔 的 结论 ,但 是 大 家 
都 普遍 认为 这 一 组 数据 是 人 为 设计 好 来 匹配 他 的 假设 的 。 作 为 一 位 伟大 的 科学 家 
和 修道 院 院 长 ， 孟 德尔 有 时 会 受 人 质疑 ， 因 为 他 的 助手 会 迎合 他 的 喜好 来 修改 实 
验 数据 。 

卡 方 检验 法 在 其 他 的 场合 也 有 广泛 的 使 用 。 在 第 3 章 中 我 们 介绍 了 泊 松 分 布 
以 及 它 在 稀有 不 可 预测 事件 中 的 运用 。 我 在 新 奥尔良 写 这 本 书 的 时 候 飓 风 季 就 要 
到 来 了 ， 不 知道 每 年 由 风 的 数量 是 不 是 也 符合 泊 松 分 布 。 飓 风 的 形成 是 人 们 无 法 
预测 的 ， 并 且 在 特定 的 时 间 段 也 是 稀有 的 ， 所 以 应 当 符合 泊 松 分 布 。 近 半 个 世纪 
以 来 平均 每 年 采风 的 数量 比 6 稍 小 。 如 果 我 们 把 6 当成 泊 松 分 布 的 期 望 值 ， 那 么 
我 们 可 以 计算 出 飓风 每 年 发 生 0 次 、1 次 、2 次 等 的 年 数 的 期 望 值 了 ， 然 后 把 这 
些 数 值 与 实际 的 数值 比较 。 通 过 卡 方 检验 法 的 检验 我 们 发 现 泊 松 分 布 非常 适用 。 
在 图 8-5 中 你 可 以 看 到 1935 年 到 2005 年 现实 和 预期 的 飓风 次 数 ， 它 们 惊人 的 
一 致 。 
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图 8-5 1935 ~ 2005 年 间 北大 西洋 热带 气旋 的 实际 次 数 和 预期 次 数 
图 8-5 左 图 为 实际 次 数 ， 其 中 没有 任何 一 年 没有 飓风 或 只 有 1 次 飓风 的 ， 发 生 两 次 刚 
风 的 有 两 年 。 而 自 名 昭著 的 2005 年 有 15 次 飓风 。 图 8-5 右 图 则 是 依照 泊 松 分 布 画 出 的 预 
期 图 。 


8.7 结语 


在 第 2 章 中 布 羔 恩 : 埃 弗 里 特 曾 经 在 其 著作 《机 会 规则 : 概率、 风险 和 统计 
的 非 正 式 指南 》 中 指出 : 统计 学 家 在 鸡尾酒 会 上 没有 那么 受 欢迎 。 这 一 点 我 在 本 
书 的 开篇 也 转弯 抹 角 地 说 过 了 。 我 希望 读 完 这 一 章 你 对 这 些 统 计 学 和 统计 学 家 们 
的 看 法 有 所 改变 。 现 代 社 会 中 我 们 需要 收集 和 分 析 各 式 各 样 的 数据 ， 毫 无 疑问 统 
计 学 也 越 来 越 重要 。 各 类 书籍 文献 中 滥用 统计 学 的 术语 却 也 是 统计 学 重要 性 凸显 
的 不 地。 我 最 近 在 电视 上 看 到 一 个 广告 ， 宣 称 如 果 使 用 了 它 的 保养 品 你 的 皮肤 就 
可 以 看 起 来 “ 比 实际 年 龄 年 轻 10 岁 ”。 我 完全 不 知道 这 句 话 在 表达 什么 意思 。 

概率 学 家 们 除了 有 专业 知识 之 外 并 不 像 普通 人 想象 的 那样 是 无 趣 的 干 瘤 小 老 
头 ， 他 们 也 是 非常 有 意思 的 人 。 如 果 知 识 也 可 以 像 德 国 坦克 、 伯 克利 大 学 的 案 
子 、 重 德尔 的 助理 这 些 故 事 一 样 广 为 认 知 ， 那 么 概率 学 家 再 也 不 用 在 社交 场合 假 
装 成 宇航 员 、 海 豚 训 练 师 甚 至 是 保险 精算 师 来 避免 被 人 扳 立 。 说 不 定 他 们 就 成 为 
了 人 和 群 中 的 焦点 ， 谁 知道 呢 ? 毕 竞 有 一 位 天 才 曾 经 说 过 统计 学 充满 了 “ 美 与 趣 
味 ”， 这 样 美 好 的 东西 有 谁 会 满足 呢 ? 
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计算 机 模拟 


1. 计算 机 “随机 ”产生 的 数 就 是 随机 数 吗 ? 

2. 数字 1 好 像 总 是 排 在 第 一 位 ， 数 字 9 就 真 的 如 其 名 甚 少 排 在 第 一 吗 ? 

3. 怎样 可 以 如 福尔摩斯 般 敏 锐 地 发 现 选 举 投票 统计 数据 中 的 欺诈 问题 ? 
切 的 根源 都 在 于 对 随机 性 的 把 握 ! 
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9.1 角子 与 模 运 算 


虽然 模拟 常 被 视 为 是 获取 复杂 系统 信息 的 一 种 手段 ， 但 “模拟 ”一 词 却 表 
达 了 很 多 不 同 的 含义 。 依 照 韦 氏 在 线 词典 的 解释 ， 模拟 是 “通过 其 他 系统 或 过 
程 的 运行 来 模仿 展示 某 个 系统 或 者 过 程 ”。 我 们 也 许 会 认为 具有 计算 机 才 可 以 
进行 模拟 ， 其 实 不 然 。 例 如 ， 在 飞行 员 特 训 中 ， 规 定 沿 着 特定 抛物 线 轨 迹 飞行 
就 是 为 了 模仿 太空 中 的 失重 状况 。 即 使 我 们 把 条 件 限制 到 计算 机 模拟 ， 这 依然 
有 很 多 层 含 义 。 飞 行 员 会 坐 在 飞行 模拟 融 中 训练 ， 护 士 会 用 到 医疗 模拟 器 来 模 
仿 病人 真正 的 反应 ， 天 气 预报 会 使 用 图 像 计算 机 模拟 来 描述 飓风 对 沿海 地 区 
的 有 影响。 然而， 对 于 概率 主义 者 来 说 ,模拟 意 味 着 “模拟 随机 性 ”。 和 图 外 
人 谈论 时 ,我 们 有 时 会 用 “蒙特 卡 罗 模 拟 法 ”这 一 术语 来 强调 模拟 的 随 
机 性 。 

模拟 的 主要 作用 在 于 估算 难以 准确 计算 的 数量 。 就 拿 轮 盘 和 21 点 来 说 。 对 
于 轮 盘 游戏 来 说 ， 概 率 和 预期 收入 都 是 非常 容易 计算 出 来 的 。 但 是 由 于 21 点 的 
规则 更 为 复杂 ， 策 略 选择 更 多 ， 精 准 概率 计算 变 得 很 难 。 当 用 计算 机 进行 模拟 游 
戏 ， 记 录 下 每 局 使 用 不 同 策略 时 的 游戏 的 输赢 ， 计 算 就 简单 多 了 。 计 算 机 多 次 模 
拟 之 后 再 计算 平均 的 收入 ， 这 个 值 就 近似 于 预期 收入 了 。 但 是 要 注意 “多 次 ” 
和 “近似 于 ”这 两 个 词 。 这 意味 着 我 们 是 基于 大 数 定律 用 观测 到 的 平均 值 来 估 
计 这 个 难以 计算 的 未 知 预期 收入 的 值 。 计 算 机 的 运行 速度 非常 快 ， 这 就 保证 我 
们 可 以 通过 大 量 的 模拟 次 数 来 保证 模拟 结果 的 可 靠 性 。 

模拟 的 对 象 本 身 的 意义 可 能 与 随机 性 没有 什么 关系 。 早 期 模拟 的 范例 是 布 丰 
投 针 法 计算 的 值 。 针 本 身 没 有 任何 意义 ， 它 们 只 是 计算 下 值 的 工具 。 年 代 再 
近 一 些 的 一 个 更 为 常用 的 例子 是 蒙特 卡 罗 积 分 法 ， 它 是 利用 随机 数 来 计算 曲线 下 
方 的 面积 ( 见 图 9-1)。 左 图 和 右 图 是 同一 条 曲线 ， 如 果 你 知道 曲线 的 公式 ， 那 
么 你 就 能 通过 微 积分 计算 出 面积 (通过 计算 曲线 函数 的 积分 ) 。 如 果 你 不 知道 这 
个 公式 ， 我 们 可 以 像 右 图 一 样 将 曲线 放 在 一 个 矩形 区 域内 ， 并 在 和 矩形 内 随意 地 画 
上 很 多 点 。 这 些 点 在 曲线 之 下 的 概率 等 于 曲线 之 下 的 区 域 占 整个 矩形 的 比例 。 所 
以 当 我 们 随机 面 许多 个 点 ， 然 后 计算 出 这 些 点 在 曲线 之 下 的 比例 ， 得 到 的 值 近似 
于 曲线 之 下 面积 所 占 的 比例 。 这 就 是 大 数 定律 在 实践 中 的 运用 ， 它 告诉 我 们 相对 
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频率 可 以 稳定 在 真正 的 概率 附近 。 在 图 中 我 画 了 200 个 点 ， 其 中 84 个 点 在 曲线 
之 下 ， 因 此 比例 为 0. 42。 而 真正 的 值 为 0.416， 两 者 非常 接近 。 在 这 个 例子 中 我 
实在 是 太 走运 了 ， 其 实 要 得 到 一 个 更 可 靠 的 数值 我 应 该 画 上 千 个 点 才能 确保 得 出 
的 值 有 良好 的 精确 度 。 























图 9-1 蒙特 卡 罗 积 分 法 


模拟 的 另 一 个 重要 的 应 用 就 是 评估 新 型 复杂 的 统计 方法 。 假 设 一 位 统计 学 家 
发 明了 一 种 新 的 方法 ， 可 以 通过 民 调 更 准确 地 预测 选举 结果 。 通 过 理论 来 计算 基 
本 是 不 可 能 的 ， 由 于 之 前 并 没有 实践 检验 的 基础 ， 所 以 她 也 没有 办 法 用 数据 来 检 
验 这 一 方法 的 准确 性 。 计 算 机 模拟 让 这 种 检验 成 为 可 能 。 她 可 以 通过 计算 机 反复 
模拟 各 种 场景 来 发 现 其 预测 与 真实 结果 之 间 的 差距 ( 因为 是 她 自己 决定 真实 结 
的 数据 ， 所 以 她 始终 掌控 着 一 切 ) 。 

对 模拟 技术 的 需求 远 远 早 于 计算 机 的 诞生 。 高 尔 顿 副 士 当然 不 会 错过 随机 性 
的 创造 。 他 1890 年 在 《自然 》 杂 志 上 发 表 了 一 篇 名 为 《统计 试验 的 骨 子 》 的 文 
草 。 他 说 : 

“目前 为 止 我 还 没有 找到 比 骨 子 更 好 的 创造 随机 性 的 工具 。 每 次 洗 牌 之 后 再 
连续 抽出 牌 或 者 将 一 堆 标 记过 的 球 混在 一 个 袋子 里 都 非常 复杂 见长 。 在 模拟 四 方 
陀螺 或 者 某 些 轮 盘 游戏 时 常会 用 到 这 些 工具 ,但 是 最 好 的 工具 是 骨 子 。 它 们 在 中 
子 里 疯狂 地 摇动 ， 互 相 撞 击 ， 没 有 人 在 事前 可 以 通过 任何 信息 得 知 它们 的 位 置 。 
每 掷 出 一 次 结果 之 后 再 播 一 次 。 

高 尔 顿 接着 继续 介绍 如 何 制作 山 子 。 这 些 侦 子 是 用 红木 〈 还 可 以 用 其 他 什么 
材料 ) 做 成 边 长 为 1.25 英寸 的 正方 体 ， 每 一 个 面 每 一 条 边 上 都 做 上 标记 。 掷 到 
哪 一 个 方向 就 对 应 不 同 面 和 边 。 他 还 设计 出 了 一 款 有 加 减 符号 的 崩 子 。 他 认为 用 
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六 个 骨 子 是 “最 有 效 的 方式 ”。 

高 尔 顿 关注 到 仍 子 掷 出 来 的 结果 是 完全 无 法 预测 的 ， 这 一 点 让 人 折服 。 现 代 
计算 机 所 谓 随机 生成 的 数字 ， 其 实 一 点 也 不 随机 ， 只 是 在 使 用 一 流 的 骗术 在 欺骗 
大 家 。 计 算 机 程序 本 身 是 无 法 随机 自动 生成 数字 的 。 它 通过 计算 一 群 已 经 设 定好 
的 数字 的 一 些 对 数 来 生成 一 连 串 的 数字 .92 这些 数 字 看 起 来 是 随机 的 ， 但 其 实 不 
然 。 我 们 无 需 像 1997 年 的 电影 《 洛 城 机 密 》 中 盖 . 皮尔 斯 饰演 的 那个 侦探 中 尉 
艾 德 . 埃 克 斯 利 那样 苛刻 : 

“长 得 像 拉 娜 . 特 纳 的 妓女 依然 只 是 妓女 。 她 只 不 过 是 长 得 像 拉 娜 . 特 纳 
而 已 。” 

恰恰 相反 ， 即 使 有 人 已 经 知道 可 以 用 对 数 来 完全 确定 每 一 个 数字 ,但 是 这 些 
由 计算 机 生成 的 被 称 为 “ 伪 随 机 ”数字 是 非常 有 用 的 。 让 我 们 进一步 看 看 这 些 
随机 数字 是 怎么 样 产生 的 。 生 成 的 途径 非常 多 ， 我 只 描述 其 中 一 种 最 为 常见 的 
同 余 法 随机 数字 生成 器 。 这 种 生成 器 使 用 的 是 模 运 算 。 你 也 许 会 说 自己 不 知道 
这 个 运算 方式 ， 你 错 了 ， 你 肯定 知道 怎么 运用 模 加 法 ， 你 只 是 不 知道 这 个 名 词 
和 姜 了 。 

模 运 算是 对 有 限 集 合 的 普通 运算 ， 最 小 数 总 是 跟 在 最 大 数 的 后 面 ， 它 们 就 像 
是 钟 面 上 的 数字 一 样 ， 一 圈 转 完 之 后 就 会 重复 。 (20 世纪 70 年 代 末 人 和 手 一 块 的 
数字 电子 表 终 于 消失 了 。 它 们 对 于 理解 模 运 算 百 害 而 无 一 利 。 对 此 我 感到 非常 
欣慰 。) 再 举 一 个 例子 。 用 数字 1 到 7 来 表示 从 周一 到 周 日 的 每 一 天 。 当 我 们 
数 到 7 之 后 就 又 会 出 现 1。 假设 现在 是 周二 ， 九 天 之 后 是 周 几 ? 显然 这 跟 两 天 
之 后 是 一 样 的 : 周 四 。 因 为 周二 对 应 的 数字 是 2， 当 你 加 上 9 之 后 得 到 了 11。 
但 当 你 数 到 7 之 后 又 必须 重新 开始 计算 ， 于 是 你 得 到 了 数字 4， 对 应 的 是 星期 
四 。 恭 喜 你 ， 你 刚才 运用 2 加 上 9， 以 7 为 模 ， 最 终 得 到 了 4。 这 一 过 程 的 书 
面 表达 式 是 
























































2+9=4 (mod7) 
换 种 说 法 ， 当 以 7 为 模 时 4 和 11 同 余 ， 在 此 种 类 型 的 计算 下 它们 是 相同 的 。 任 
何 数 乘 以 7 再 加 上 4 都 与 4 同 余 。 这 些 数 的 集合 为 14，11，18，…| ， 是 以 7 为 


3 ”顺便 提 一 句 ， 韦 氏 词 典 中 模拟 的 另 一 个 定义 就 是 “ 伪 对 象 ”。 
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模 4 的 同 余 类 〈 你 也 可 以 用 负数 乘 以 7， 得 到 的 数 如 -3，- 10 等 也 是 此 集合 的 
数字 ) 。 如 果 你 计算 的 是 月 份 ， 那 么 就 要 以 12 为 模 数 ; 如 11 +3 =2(mod 12)， 
即 十 一 月 之 后 再 过 三 个 月 就 是 二 月 。 如 果 你 不 是 美国 人 (或 者 你 在 美国 海军 服 
役 ) ， 你 通过 以 24 为 模 数 的 运算 来 计算 时 间 。 例 如 15 + 10 =1(mod 24) ， 即 下 午 
三 点 之 后 再 过 十 个 小 时 是 凌晨 一 点 。 

现在 你 已 经 知道 如 何 运用 模 运 算 了 。 那 么 如 何 运用 它 来 帮助 你 生成 随机 数字 
呢 ? 同 余 随 机 数字 生成 器 先 写 出 一 些 数字 ( 这些 数 字 被 称 为 种 ) ， 然 后 将 这 些 数 
乘 以 一 个 常数 ， 再 加 上 另外 一 个 常数 。 再 将 得 出 来 的 数字 计算 以 为 模 数 的 余 
数 ， 从 而 得 到 11，2，…，z+ 的 集合 。 当 你 生成 第 个 数字 XX 之 后 ， 下 一 个 数 
字 ww 可 以 通过 公式 

















Kir =QXx + (modn) 

计算 出 来 ， 其 中 a 和 ,的 值 是 已 知 的 。 要 得 到 一 组 长 的 序列 ， 通 常 需要 满足 两 个 
条 件 : 

(a) 任何 数字 出 现 的 概率 相同 ; 

(b) 无 法 预测 下 一 个 数字 。 
用 掷 蜗 子 来 举 一 个 简单 的 例子 。 此 时 于 =6， 集 合 为 11，2，…，6|。 今 c=0 = 
1， 选 择 以 1 为 种 子 ， 很 容易 得 出 1, 2, 3, 4, 5, 6, 1,，2,……… 这 一 组 数 。 但 
是 这 一 组 数字 只 符合 条 件 (a) 不 满足 条 件 (b)。 青 令 a =3, b=5， 同样 以 1 为 
种 。 第 一 个 数字 是 3 x1 +5 =8， 减 去 6 之 后 得 到 2， 所 以 8 =2 (mod 6)。 接 下 来 
的 几 个 数字 是 








3x2+5=11=5 (mod 6) 
3x5+5=20=2 (mod 6) 
然后 整个 序列 不 断 重复 2，5，2，5，…， 没 有 其 他 的 数字 出 现 ， 很 快 我 们 就 可 以 
发 现 规律 ， 显 然 这 也 不 是 一 个 恰当 的 序列 。 你 也 许 发 现 了 运用 这 种 方法 似乎 也 不 
能 生成 很 好 的 数列 。 最 好 的 大 概 就 是 随机 包含 1 ~6 的 序列 ， 然 后 无 限 重复 。 我 
们 甚至 生成 不 出 3，3 ，1，… 这 样 的 序列 ， 因 为 如 果 第 一 个 3 会 产生 另 一 个 3 时 ， 
新 产生 的 3 就 会 继续 生成 3。 现 在 我 们 需要 一 些 更 聪明 的 方法 。 
令 n=60， 将 每 个 数字 除 以 10 并 向 上 爸 入 到 最 近 的 整数 ， 来 模拟 投 骨 子 。 这 
就 意味 着 1 ~ 10 之 间 的 数字 最 终 会 得 到 数字 1， 而 11 ~20 之 间 的 数字 会 得 到 数字 
2。 假设 a =11, 5=13， 同 样 以 1 为 种 ， 那 么 第 一 个 数字 是 11 x1 +13 =24, 将 
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结果 除 以 10 得 到 2.4， 含 人 到 最 近 的 整数 3。 将 24 代入 运算 , 11 x24 +13 =277 = 
37(mod 60) 同样 得 到 整数 4。 在 1 ~60 之 间 的 数字 运算 ， 其 中 2 可 以 生成 数字 4 
也 可 以 生成 数字 3。 对 应 模拟 掷 山 子 的 结果 就 是 1，2，4，5，2，3， 这 上 比 之 前 看 
起 来 真实 多 了 。 虽 然 我 们 生成 的 序数 在 不 断 改进 ， 但 是 最 终 它 还 是 会 重复 。 出 现 
重复 之 前 的 序数 的 长 度 叫 做 随机 数 生成 器 的 周期 ， 显然 我 们 希望 这 个 周期 越 长 
越 好 。 

当 我 们 令 n =600， 除 数 为 100 或 令 n =6000， 除数 等 于 1000 时 ， 人 情况 会 更 
好 。 总 而 言 之 我 们 假设 一 个 非常 大 的 数字 m， 令 n=6 xm， 然 后 将 n 除 以 m 并 使 
和信 到 最 近 的 整数 来 模拟 掷 恕 子 的 结果 。 我 尝试 了 当 半 =6000000，a =374511，5 = 
977597 的 情形 (a 和 必 可 以 随意 取 值 ) ， 此 时 得 到 的 前 二 十 次 掷 仍 子 的 结果 是 

251414212355466342141355 

通过 仔细 地 检查 ， 发 现 这 些 数字 在 长 期 模拟 中 出 现 的 概率 是 相等 的 。 但 这 依然 不 
是 一 个 好 的 随机 数 生 成 器 。 因 为 我 们 必须 要 谨慎 地 选择 数字 a 和 》 的 值 ， 才 能 使 
周期 的 长 度 保证 序列 的 随机 性 。 例 如 ， 当 =600 时 ,， 令 ic=1，2 = 100 就 会 出 现 
序列 一 直 在 重复 1，2，3，4,，5，6。 数 论 的 数学 原理 告诉 我 们 如 何 恰当 地 给 a， 
5b, n 赋值 。 数 论 是 最 纯粹 的 数学 理论 ， 它 的 实践 者 们 穷 其 一 生 都 在 研究 素数 和 
其 他 非常 高 深 的 理论 。 有 趣 的 是 这 个 数学 的 高 度 理论 化 的 分 支 不 仅仅 在 模拟 上 发 
挥 了 作用 , 在 密码 学 上 也 是 大 放 异 彩 。 英 国 数学 家 高 德 菲 . 哈 罗 德 . 哈代 
(Hardy，Godfrey Harold)(1877 一 1947) 曾经 预言 到 : 

“ 毫 无 疑问 ， 纯 粹 数学 从 整体 上 来 说 比 应 用 数学 有 用 得 多 1” 

我 敢 保证 他 肯定 没有 想 过 掷 人 般 子 。 

大 部 分 计算 机 的 编程 语言 和 小 型 计算 器 都 有 随机 数 生成 器 的 功能 。 你 按 下 对 
应 的 功能 键 ， 就 会 产生 一 些 0 ~1 之 间 的 小 数 ， 比 如 0.3425 ，0. 9010。 这 些 数字 
产生 的 方式 与 我 之 前 介绍 的 方法 异曲同工 。 它 们 都 是 模拟 的 基石 。 用 一 个 简单 的 
计算 器 就 能 得 到 许多 小 数 ， 为 了 实践 的 目的 我 们 可 以 假设 所 有 0 ~1 之 间 的 小 数 
出 现 的 概率 都 是 等 可 能 的 。 为 了 模拟 撕 骨 子 的 试验 ,我们 可 以 假设 1~1/6 之 间 
的 数字 对 应 的 1，1/6 ~2/6 之 间 的 数字 对 应 的 2， 以 此 类 推 。 当 需要 模拟 硬币 试 
验 时 ， 我们 可 以 令 0~0.5 之 间 的 数字 对 应 正面 ， 而 0.5 ~1 之 间 的 数字 对 应 反面 
( 见 表 9-1)。 

当 模 拟 的 对 象 对 应 的 概率 并 非 相 等 时 ， 你 只 需要 将 [0, 1] 的 区 间 依 据 概 
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率 分 成 对 应 的 部 分 。 例 如 你 想 要 模拟 有 两 个 孩子 的 家 庭 中 女儿 的 数量 ， 结 果 可 能 
是 0，1，2， 对 应 的 概率 为 /4，17Z2 和 1/4。 这 时 ,你 可 以 将 0 ~1/4 之 间 的 数 
对 应 0 个 女儿 的 情况 ， 而 1/4 ~3/4 之 间 的 数 对 应 1 个 女儿 的 情况 ，3/4 ~1 之 间 
的 数字 对 应 2 个 女儿 的 情况 。 

如 果 模 拟 的 是 更 为 复杂 的 概率 分 布 那么 就 需要 更 加 复杂 的 演练 。 你 可 以 通过 
随机 选择 的 4、B 两 个 数字 利用 下 列 公式 来 计算 工 的 值 : 

X=0 x V2 logAxcos(2xT xB) + 从 

此 时 对 符 合 均 值 为 ,方差 为 o 的 正 态 分 布 。 讨 厌 的 5 又 出 现 了 ,现在 你 大 概 再 
也 不 会 觉得 它 的 出 现 很 突 雹 了 。 当 我 们 想 要 模拟 出 一 千 个 均值 为 100， 方差 为 15 
的 智商 分 数 时 ， 我 们 可 以 随机 生成 两 千 个 数字 ， 然 后 成 双 成 对 地 计算 出 式 的 一 千 
个 值 。 图 9-2 画 出 了 这 种 模拟 的 情况 。 图 中 虚线 是 理论 上 的 钟 形 曲线 。 

表 9-1 对 应 硬币 正 反面 的 随机 序列 




















































































































随机 数字 硬币 正 反面 

0. 9501 反面 

0. 2311 面 

0. 1068 面 

0. 4860 面 

0. 8913 反面 

0.7621 反面 

0. 4565 面 

9 | 0 100 56 

0. 8214 反 

0. 4447 正面 图 9-2 一干 个 均值 为 100， 
0654 | pr 面 方差 为 15 的 智商 分 数 





9.2 随机 与 并 非 那么 随机 的 数字 


在 过 去 的 很 长 一 段 时 间 内 ， 许 多 问题 用 高 尔 顿 的 红木 仍 子 无 法 解决 ， 人 们 需 
要 更 广泛 的 随机 数 集合 ， 当 时 计算 机 尚未 问世 。 此 时 常常 使 用 的 是 随机 数 表 。 这 
些 表 中 的 数字 来 源 五 花 八 门 。 伦 纳 德 . 带 皮 特 收 集 并 于 1927 年 发 表 的 41600 个 
随机 数字 表 就 是 早期 随机 数 表 的 代表 。 蒂 皮特 是 从 人 口 普查 的 数据 中 得 到 这 些 数 
字 的 ， 他 宣称 这 些 数字 是 随机 选择 的 ， 任 何 数字 都 没有 特殊 的 含义 。 他 从 袋子 中 
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型 





随机 抽取 写 有 数字 的 卡片 。 这 种 方法 非常 的 繁琐 ， 并 不 尽 如 人 意 (他 应 该 读 读 高 
尔 顿 的 书 ) 。1995 年 兰 德 智库 出 了 一 个 本 书 《 一 百 万 个 随机 数字 》， 这 本 书 中 
含 了 通过 电子 轮 盘 得 到 的 一 百 万 个 随机 数字 ( 是 的 ， 就 是 一 百 万 个 ) 。 我 节选 
一 部 分 数字 : 


ey 


JE 


13073 43556 45009 13436 

58884 93194 33498 01299 
这 些 数 字 是 书 上 来 的 吗 ? 不 要 告 我 简 穷 ， 也 许 这 些 数字 就 是 我 自己 编造 的 。 你 可 
以 自己 去 核实 一 下 。 这 本 书 在 2001 年 的 时 候 再 版 了 ， 亚 马 进 上 有 几 本 二 手书 在 
出 售 。 显 然 人 们 只 记得 这 些 数字 ， 却 忘记 了 书本 身 。 

在 兰 德 智库 的 网 站 上 ， 它 宣称 依然 在 使 用 这 个 表 。 这 一 点 我 持 怀疑 态度 。 现 

在 任何 一 个 计算 机 软件 ， 比 如 MATLAB 可 以 用 不 到 一 秒 的 时 间 生 成 一 百 万 个 数 
字 。 但 是 这 本 书 在 其 诞生 时 依然 有 重大 的 意义 ， 当 时 写 出 这 本 书 需要 极 大 的 创造 
力 。 我 依然 记得 上 高 中 时 我 们 的 数学 用 表 上 有 一 页 纸 就 写 满 了 随机 数字 。 它 们 每 
天 都 是 一 样 的 ， 我 一 点 也 不 理解 它 随机 在 哪里 。 当 你 用 到 小 型 计算 器 时 ， 你 感觉 
有 一 些 随 机 的 东西 就 从 一 个 小 盒子 里 出 来 了 。 这 些 就 是 我 们 说 的 错觉 。 但 是 用 现 
代 的 计算 机 设备 给 我 们 的 生活 增添 一 点 神秘 感 也 是 不 错 的 。 随 机 数 表 实 在 是 过 于 
冷静 客观 。 




















9.3 数字 1 排 在 第 一 位 


从 一 个 大 的 数据 集合 中 随机 选取 一 些 数字 来 生成 随机 序列 是 一 个 聪明 的 想 
法 ， 但 是 你 在 选取 的 过 程 中 必须 非常 小 心 。 假 设 你 每 次 选择 第 一 位 数字 (0 除 
外 )。 那 么 数字 34. 509 和 0. 0031 的 第 一 位 数 都 是 3。 如 果 你 想 用 这 样 的 方法 来 创 
造 随机 数字 序列 ， 那 么 最 终 会 发 现 一 件 非 常 神 奇 的 事情 。1 ~ 9 之 间 的 数字 并 不 
是 等 概率 的 。 这 句 话 听 起 来 非常 鲁莽 甚至 几 近 芒 座 ， 因 为 我 压根 就 不 知道 你 要 从 
哪里 来 选择 这 些 数字 。 本 福特 定律 告诉 我 们 ， 第 一 位 数 是 1 的 概率 大 约 为 30% ， 
远 远 超过 11. 1% ， 如 果 九 个 数字 都 是 等 可 能 出 现 。 第 二 个 最 常 出 现 的 数字 是 2， 
接 下 来 是 3， 如 此 以 往 一 直到 9， 它 对 应 的 概率 只 有 4. 6% 。 

本 福特 定律 并 不 是 一 个 可 以 被 证 明 的 数学 定律 。 但 是 这 个 定律 经 过 了 大 量 的 
试验 和 观察 检验 。 表 9-2 就 是 我 依据 www. nationsonline. org 网 站 上 的 信息 ， 统 计 
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出 来 世界 各 国人 口 数据 的 第 一 个 数字 得 到 的 表格 。 图 9-3 的 左 图 给 出 了 各 个 数字 
对 应 的 概率 ， 右 图 为 本 福特 定律 的 预测 。 从 图 9-3 可 见 ， 这 些 概率 与 本 福特 定律 
之 间 有 着 怀 人 的 一 致 。 有 什么 科学 依据 可 以 合理 解释 这 种 现象 吗 ? 为 什么 1 如 此 
的 普遍 而 9 却 如 此 的 罕见 ? 

表 9-2 各 国人 口 数 第 一 位 数字 的 概率 

第 一 位 数字 1 2 3 4 5 6 7 8 9 











人 口 数据 28.2 | 17.2 | 13.7 | 10.1 | 10.1 5.3 6.6 6.6 2.2 





本 福特 定律 30.1 | 17.6 | 12.5 | 9.7 7.9 6.7 5.8 5.1 4.6 





























30 上 

















30| 
20| 20 上 
10| 10 
0 1 0 


9-3 国家 人 口 数量 第 一 位 数 分 布 


每 个 国家 的 人 口 以 一 个 相对 稳定 的 速度 在 增长 。 在 “数字 9 区 域 ” 的 国家 
如 瑞典 的 人 口 就 是 刚刚 超过 9 百 万 。 最 终 它 会 超过 一 千 万 人 口 ， 然 后 第 一 位 数 
就 变 成 了 1， 并 且 将 会 保持 很 长 一 段 时 间 直 到 人 口 的 数量 加 倍 变 成 两 千 万 。 而 
在 “数字 1 区 域 ”的 国家 有 中 国 、 日 本 和 俄罗斯 (这 些 国家 很 容易 发 现 ) ， 它 
们 将 会 长 期 停留 在 这 一 区 域 。 当 第 一 位 数字 刚刚 变 成 9 时 ， 它 增长 到 1 需要 
11% 的 人 口 增加 ,但 是 当 它 需要 从 1 增长 到 2 时 却 需 要 增长 一 倍 的 人 口 。 当 从 
2 增长 到 3 时 ， 人 口 需 要 增长 50% 。 从 一 个 数字 增长 到 另外 一 个 数字 对 应 的 人 
口 的 增长 率 不 断 下 降 ， 这 也 是 在 小 数字 区 域 保持 的 时 间 长 ， 而 在 大 数字 区 域 时 
间 短 的 原因 。 人 口 以 集合 增长 率 (在 固定 时 间 段 内 人 口 数量 成 倍增 长 ) ， 对 数 
学 敏感 的 人 也 许 会 猜测 本 福特 定律 中 包含 了 对 数 。 之 后 我 们 会 证 明 这 种 猜测 是 
对 的 。 

这 种 解释 的 方法 取决 于 人 口 的 增长 ， 但 在 其 他 本 福特 定律 的 例子 中 却 无 法 适 
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用 。 但 是 通常 说 来 作为 第 一 个 数字 时 ， 数 字 1 的 概率 总 是 会 名 列 前 茂 。 从 1 数 到 
9， 它 们 的 概率 相等 。 接 下 来 从 10 数 到 19 时 是 数字 1 打头 。20 到 29 是 以 数字 2 
打头 的 ， 依 此 类 推 直到 100 将 在 接 下 来 的 100 个 数字 保持 以 1 打头 。 总 之 不 管 如 
何 ，9 总 是 落后 于 1。 当 然 很 容易 找到 不 适用 本 福特 定律 的 集合 。 比 如 用 英寸 作 
为 单位 来 测量 人 们 的 身高 ， 数 字 6 和 7 是 最 常见 的 数字 。 而 在 加 利 福 尼 亚 州 的 邮 
政 编码 中 数字 9 终于 扬眉吐气 。 

法 兰 克 ' 本 福特 在 1938 年 于 《美国 哲学 学 会 会 报 》 上 发 表 了 一 篇 关于 该 定 
律 的 文章 ， 因 此 这 个 定律 也 以 他 的 名 字 命 名 。 但 事实 上 早 在 他 之 前 其 他 人 也 得 出 
了 相同 的 观察 结论 。 天 文学 家 西蒙 . 纽 康 (Simon Newcomb) 早 在 1881 年 就 有 
这 样 的 发 现 。 传 说 中 ， 他 是 发 现 了 对 数 表 的 书 不 同 页 码 磨 损 不 同 ， 其 中 以 1 打 
头 的 对 数 所 在 的 第 一 页 比 之 后 的 页 码 磨 损 要 严重 得 多 。 不 知道 大 家 能 在 计算 机 
键盘 上 发 现 类 似 的 磨损 情况 吗 ? 我 的 对 数 表 书 看 起 来 就 非常 的 破旧 ， 但 是 我 不 
常 计算 对 数 。 

本 福特 定律 甚至 可 以 被 用 来 检测 会 计 、 保 险 或 者 选举 投票 欺诈 问题 。 原 理 就 
在 于 : 如 果 这 些 数字 是 捏造 的 ， 那 么 很 有 可 能 捏造 者 不 会 遵循 本 福特 定律 关于 每 
个 数字 出 现在 第 一 位 的 比例 ， 于 是 只 要 有 一 个 整体 的 分 析 就 可 以 发 现 造假 之 处 。 
柯 林 … 布鲁斯 在 他 2001 年 出 版 的 书 《 又 被 骗 了 7 了， 华 生 : 逻辑 ， 数 学 和 可 能 性 的 
警示 故事 》( Conned Again, Watson: Cautionary Tales of Logic, Math, and Probabil- 
ity) 中 夏 洛 克 … 福尔摩斯 就 是 通过 运用 数学 分 析 解 决 了 众多 的 犯罪 难题 。 

你 也 可 以 用 这 个 定律 去 打 一 些 对 你 有 利 的 赌 。 你 选择 1，2，3 这 三 个 数字 ， 
让 锡 德 叔叔 选择 4 ~9 这 六 个 数字 。 让 他 选择 一 个 他 偏爱 的 数字 集合 ， 随 机 选择 
第 一 位 的 数字 ， 选 中 了 谁 的 数字 谁 就 启 了 。 即 使 你 只 选择 了 9 个 数字 中 的 3 个 ， 
依据 本 福特 定律 ，1 ~3 这 三 个 数字 对 应 第 一 位 的 概率 加 起 来 超过 了 60% ， 所 以 
锡 德 叔叔 会 输 。 

对 于 本 福特 定律 还 有 一 些 更 为 复杂 的 解释 ， 包 括 尺度 不 变 原理 、 基 数 恒 定性 
和 对 数 分 布 。 在 本 书 中 我 将 不 一 一 介绍 。 但 是 为 了 保证 得 到 准确 的 概率 ， 我 们 需 
要 做 出 一 些 必 要 的 数学 假设 ， 从 而 得 出 准确 的 计算 公式 : P (第 一 位 数 为 d) = 
logio(1+1/d)， 其 中 logwo 是 以 10 为 底 的 对 数 ，d 的 取 值 从 1 到 9。 当 4g=1 时 ， 
概率 为 log (2) ， 等 于 0.30; 10 的 0.30 次 寡 对 应 的 结果 为 2。 对 于 第 二 位 数字 
也 有 一 个 更 为 复杂 的 计算 公式 ， 通 过 这 个 公式 可 以 发 现 数字 在 第 二 位 上 分 布 的 更 
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为 不 平衡 。 第 二 位 上 最 可 能 出 现 的 数字 是 0， 概率 为 12% 。 然 后 概率 一 直下 降 ， 
数字 9 对 应 的 概率 只 有 8. 5% 。 下 降 的 幅度 没有 像 第 一 位 数字 那么 夸张 。 当 考虑 
第 三 位 上 数字 的 分 布 时 ， 这 种 下 降 的 效应 几乎 可 以 忽略 不 计 。 








9.4 难道 随机 真 的 就 是 随机 的 吗 ? 


图 9-4 为 两 次 扔 硬币 得 到 的 结果 序列 。 其 中 空心 圆圈 表示 正面 彰 上 ， 实 心 圆 
圈 表 示 反 面 朝 上 。 其 中 有 一 串 的 结果 是 随机 的 ， 另 外 一 串 则 并 非 随机 ， 而 是 人 为 
刻意 得 出 的 结果 。 你 能 分 辨 出 来 吗 ? 
() O@ OOOO0O0@ O000@@ © © O00 oe@ 
(b)O@OO@OO O00OOO 
图 9-4 两 次 扔 硬币 的 结果 


当然 不 可 以 。 在 真实 的 扔 硬币 试验 中 ， 正 面 和 反面 出 现 的 概率 是 相等 的 ， 所 
有 的 序列 对 应 的 概率 都 是 (1/2)”。 那 么 这 个 问题 就 转化 成 为 了 哪 一 串 序 列 更 有 
可 能 是 随机 产生 的 ， 它 显示 出 来 了 随机 的 特征 。 依 靠 正 反 面 出 现 的 比例 来 判断 ， 
第 一 串 序 列 中 有 13 次 正面 朝 上 ,第 二 串 序列 中 14 次 正面 朝 上 。 两 串 序列 中 正 反 
面 朝 上 的 次 数 都 接近 15 次 ， 这 种 方法 没有 用 。(b) 序列 看 起 来 正 反面 错落 有 致 ， 
而 (a) 序列 连续 正面 或 反面 的 情况 更 多 ， 看 起 来 更 可 疑 。 认 为 (a) 序列 是 假 
的 ，(b) 序列 是 真 的 ， 请 举 手 ! 
把 手 放 下 来 ; 显然 事实 正好 相反 。 (a) 序列 记录 的 是 真实 的 扔 硬币 试验 ， 
(b) 序列 是 假 的 。 除 了 考虑 正 反面 的 比例 问题 ， 我 们 可 以 考虑 从 正面 变 成 反面 
的 次 数 或 者 从 反面 变 成 正面 的 次 数 。 扔 完 第 一 次 硬币 之 后 ， 有 29 次 变化 的 可 能 
性 ， 每 一 次 发 生 的 概率 为 0.5。 所 以 变化 次 数 的 期 望 值 为 14.5。 (a) 序列 有 15 
次 变化 ，(b) 序列 有 22 次 变化 。 这 说 明了 (b) 序列 是 通过 人 为 操纵 达到 这 样 
多 次 数 的 变化 的 。 发 生 22 次 正 反 面 变 化 的 情况 有 多 极端 呢 ? 通过 二 项 式 分 布 计 
算 这 一 概率 仅 为 0. 12% ; 差不多 每 一 千 次 中 才 会 发 生 一 次 。 我 承认 (pb) 序列 是 
我 通过 将 改变 的 概率 由 0.5 提高 到 0.7 得 出 的 结果 。 此 时 变化 次 数 的 期 望 值 为 
20.3， 所 以 22 次 就 并 没有 那么 极端 了 。 

(b) 序列 中 正 反面 朝 上 的 次 数 是 按照 50-50 的 比例 分 配 的 ， 它 只 是 比 (a) 
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序列 的 变化 多 一 些 。(b) 序列 是 马尔 可 夫 链 (Markov Chain) 的 一 种 情况 。 马 尔 
可 夫 链 描述 了 一 种 状态 序列 ， 其 每 个 状态 值 取 决 于 前 一 个 状态 值 (但 是 相对 于 前 
一 个 状态 是 独立 的 ) .2 马尔 可 夫 链 是 概率 和 统计 学 中 最 重要 的 工具 ， 它 在 为 现实 
现象 构建 模型 和 计算 机 模拟 (马尔 可 夫 链 蒙特 卡 罗 方 法 或 MCMC) 中 都 发 挥 了 重 
要 作用 。 我 们 可 以 将 变化 概率 变 成 0. 3 的 序列 。 这 种 序列 中 会 出 现 更 多 次 连续 的 
正面 朝 上 或 反面 朝 上 的 情况 。 但 是 从 长 期 来 看 正 反 面 出 现 的 比例 是 会 保持 平衡 
的 。 学 习 马 尔 可 夫 链 是 个 非常 有 意思 的 过 程 ， 但 是 需要 了 解 的 数学 知识 也 远 非 我 
在 本 书 中 可 以 介绍 的 这 些 皮毛 。 

我 举 这 个 例子 是 为 了 说 明 ， 当 我 们 评价 一 个 随机 数 生成 器 时 ， 仅 仅 对 数字 或 
字符 出 现 的 比例 提出 要 求 是 远 远 不 够 的 。 这 个 要 求 只 是 第 一 个 要 满足 的 条 件 。 我 
们 还 需要 考虑 序列 中 连续 出 现 数字 或 字符 的 次 数 问题 。 比 如 在 扔 硬币 的 序列 中 ， 
连续 两 次 正面 朝 上 (如 HTTH 中 出 现 的 TT)， 连 续 三 次 正面 朝 上 (如 HTTTH 中 
出 现 的 TIT) 等 。(b) 序列 的 问题 就 在 于 连续 一 、 两 次 的 情况 太 多 ， 连 续 三 次 的 
情况 只 有 一 次 ， 之 后 不 存在 其 他 更 多 的 连续 情况 了 。 但 是 在 现实 的 扔 硬币 试验 中 
篆 带 会 出 现 比较 多 的 连续 情况 。 我 们 之 前 说 过 大 约 要 扔 一 百 万 次 才 会 出 现 一 次 连 
续 二 十 次 正面 朝 上 的 情况 , 但 是 它 总 是 会 发 生 的 。 

众所周知 ， 人 们 自己 是 最 差劲 的 随机 数 生成 者 。 我 们 生成 短 序列 还 行 ， 但 
是 当 需 要 生成 长 序列 时 我 们 常常 会 想 出 〈(b) 序列 那样 的 序列 其 中 包含 了 大 
多 的 变化 。 我 们 记 住 了 之 前 做 了 什么 事情 ， 比 如 当 我 们 生成 了 四 次 正面 朝 上 的 
情况 我 们 就 会 想 下 一 次 要 反面 朝 上 了 。 即 使 我 们 知道 每 一 次 都 是 独立 的 事件 ， 
我 们 还 是 会 过 于 担心 比例 问题 。 还 记得 我 们 之 前 举 的 汤姆 和 哈 利 玩 硬 币 游戏 的 
例子 吗 ? 虽然 这 个 游戏 非常 的 公平 ， 但 还 是 会 有 一 个 玩家 在 大 部 分 时 间 内 都 会 
保持 领先 地 位 。 人 们 在 随机 性 的 认 知 上 存在 些许 问题 ， 也 许 需 要 强 记 经 验 法 
则 : 当 它 看 起 来 是 随机 的 ， 它 其 实 不 是 ; 当 它 看 起 来 不 像 随机 的 ， 它 却 是 随 
机 的 。 



































”马尔 可 夫 链 ， 因 俄国 数学 家 安 德 烈 . 马尔 可 夫 (Andrey Andreyevich Markov，1856 一 1922) 得 名 ,他 
是 切 比 雪夫 的 学 生 。 马 尔 可 夫 创 造 性 地 将 马尔 可 夫 链 运用 到 对 普希金 1833 年 写 的 长 诗 《 叶 甫 盖 尼 … 
奥 涅 金 》 的 元 音 和 辅音 分 析 中 。 马 尔 可 夫 发 现 元 音 后面 跟 着 辅音 的 概率 为 87% ， 而 辅音 后 面 跟着 元 
音 的 概率 为 66% 。 遗 憾 的 是 我 们 对 数据 痴迷 的 老 朋友 高 尔 顿 鳃 士 也 许 从 未 听 说 过 马尔 可 夫 的 发 现 。 
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数学 家 们 研究 的 另外 一 个 问题 就 是 5 的 各 个 位 数 是 不 是 随机 的 。 这 个 问题 听 
起 来 似乎 很 蕊 雇 。~ 作为 圆周 率 ， 从 阿 基 米 德 那个 时 代 开 始 就 没有 改变 过 .9 但 
就 像 我 高 中 时 期 的 随机 数 表 一 样 ， 这 个 问题 本 质 是 在 问 r 的 各 个 位 数 是 不 是 也 能 
随机 生成 (数学 家 们 称 这 个 数字 是 常态 的 ) 。 有 没有 偏离 数字 0 ~ 9 的 比例 分 配 或 
是 其 他 可 以 辨别 的 模式 ?9 管 案 似 乎 是 否定 的 。 我 们 用 随机 数 生成 器 生成 的 数字 
来 检测 5 的 值 ， 发 现 这 个 古老 的 数字 真 的 创造 得 非常 好 。 如 果 你 恰好 是 一 位 语言 
学 家 ， 你 可 以 从 3，1，4 开始 随便 生成 随机 数字 。 如 果 你 怕 被 人 发 现 吹牛 ， 你 可 
以 借用 一 下 2 的 平方 根 或 是 2 的 对 数 或 者 把 两 者 混合 一 下 。 随 便 你 怎么 发 挥 创 
造 力 。 

如 果 你 想 利用 天 各 个 位 数 上 的 数字 来 生成 一 串 扔 硬币 序列 ， 你 可 以 用 到 二 进 
编码 来 表示 。 也 许 你 不 太 熟 悉 二 进 制 或 者 已 经 忘 了 。 二 进 制 不 同 于 我 们 通常 以 
10 为 基 的 计数 方式 ， 它 是 以 2 为 基 的 计数 方式 。 比 如 7 刚 开 始 的 几 位 数 是 
3. 1415 ，3 表示 有 3 个 一 ，1 表示 有 1 个 十 分 之 一 ,4 表示 有 4 个 百 分 之 一 ， 以 此 
类 推 。 用 二 进 制 的 方法 ， 我 们 需要 计算 的 是 2 的 容 。 比 如 3 等 于 2 +1， 所 以 整数 
部 分 的 3 写成 二 进 制 的 方式 就 是 11。 接 下 来 我 们 可 以 加 上 17Z2 吗 ? 不 可 以 ，0.5 
太 大 了 。 那 可 以 加 上 1/4 吗 ? 也 不 可 以 。 那 1/8 呢 ? 这 就 可 以 ， 因 为 1/8 等 于 
0.125， 这 比 0.14 要 小 。 加 上 178 之 后 我 们 还 可 以 再 加 上 1716 吗 ? 不 可 以 ， 
那样 的 话 得 出 来 的 数字 就 变 成 了 3. 1875， 超 过 5 的 值 了 。 综 合 考 虑 ，” 的 值 
用 二 进 制 表 示 刚 开始 的 几 位 数 应 该 为 11.0010。 现 在 我 们 用 1 表示 正面 朝 上 ， 
0 便 是 反面 朝 上 ， 就 可 以 得 出 一 串 序列 。~7 用 二 进 制 表 示 前 二 十 位 转化 成 扔 硬 
币 对 应 的 情形 为 HHTTHTTHTTTTHHHHHHTH。 这 样 看 起 来 非常 的 正常 ， 你 觉 
得 呢 ? 

虽然 我 们 不 擅长 识别 随机 性 ， 但 是 至 少 我 们 知道 一 串 扔 硬币 随机 序列 看 起 来 
应 该 是 什么 样 的 。 正 面 朝 上 和 反面 朝 上 的 比例 要 相等 ， 连 续 正 反面 的 次 数 和 其 他 

















日 ”印第安 纳 州立 法 机 关 曾 经 在 1897 年 的 时 候 试图 改变 圆周 率 。 印 第 安 纳 州 众议院 通过 了 一 个 法 案 宣 
称 7 的 值 是 不 正确 的 ， 应 该 是 3，2 (法 案 中 还 出 现 了 一 些 其 他 的 数字 ) 。 参 议院 将 《印第安 纳 州 
7 法案》 无 限期 延期 了 ， 不 知道 在 不 久 的 将 来 这 个 法 案 会 不 会 重新 投票 。 

四 “666” 第 一 次 出 现 是 在 2240 位 之 后 。“666” 出 现 的 预期 值 是 1110 位 ， 所 以 圣经 数字 命理 学 家 认 
为 不 是 魔鬼 创造 的 。 
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一 些 模式 也 要 符合 比例 ， 等 等 。 另 外 一 个 更 加 具有 实践 意义 的 问题 就 是 真正 的 扔 
硬币 试验 结果 有 多 随机 ? 在 6. 1 节 中 我 介绍 了 斯 坦 福 教授 佩 尔 西 . 戴 康 尼斯 用 他 
的 拇指 来 制造 完全 非 随机 的 扔 硬币 序列 。 他 高 超 的 投 币 技巧 和 丰富 的 概率 知识 让 
他 对 真实 的 试验 究竟 有 多 随机 这 个 问题 产生 了 浓厚 的 兴趣 。 从 某 种 意义 上 来 说 ， 
在 我 们 已 经 知道 初始 的 旋转 速度 和 速率 时 ， 我 们 可 以 运用 牛顿 定律 来 计算 出 最 终 
停 下 来 的 位 置 ( 当 硬 币 落 在 了 一 个 硬 物 之 上 又 弹 起 来 继续 旋转 了 ， 这 个 问题 就 复 
杂 得 多 了 ) 。 这 样 的 话 其 实 扔 硬币 一 点 也 不 随机 。 随 机 性 就 在 于 最 初 条 件 的 不 确 
定性 ， 我 们 普通 人 通过 自己 不 敏感 的 手 完全 无 法 复制 ， 同 时 很 小 的 变化 会 导致 最 
终结 果 的 大 不 相同 ,9 

《统计 科学 》( Statistical Science ) 杂志 在 1986 年 刊登 了 一 篇 名 为 《与 佩 尔 
西 . 戴 康 尼斯 的 对 话 》(“A conversation with Persi Diaconis”) 的 文章 。 这 个 魔术 
师 、 概 率 学 家 解释 自己 是 如 何 使 用 频 闪 观测 仪 来 反复 测量 将 硬币 扔 到 一 英尺 高 时 
最 初 的 速度 和 旋转 速率 的 。 他 的 研究 发 现 硬币 在 落地 之 前 旋转 的 次 数 变化 不 大 ， 
所 以 连续 的 扔 硬币 并 不 是 完全 随机 的 。 在 戴 康 尼斯 、 办 珊 ' 霍 尔 曼 和 理 查 德 ， 蒙 
哥 马 利 近 期 合 著 的 一 篇 文章 《 扔 硬币 的 动态 偏差 》(“Dynamical Bias in the Coin 
Toss”) 中 ， 他 们 从 理论 上 用 物理 学 定律 和 在 实践 中 使 用 投 币 机 (不 知道 高 尔 顿 
士 的 阁楼 上 有 没有 这 些小 玩意 ) 更 为 仔细 地 观察 了 扔 硬币 试验 。 他 们 得 出 一 个 
结论 : 正常 的 硬币 下 一 次 投 币 的 结果 更 可 能 与 本 次 结果 相同 ， 概 率 大 概 为 51% ， 
而 不 是 理想 的 50 对 50。 这 种 偏离 对 结果 影响 并 不 明显 ， 所 以 在 足球 比赛 中 依然 
还 是 会 用 扔 硬币 的 形式 来 决定 谁 开 球 (裁判 可 以 在 手中 摇晃 硬币 ,这样 就 没有 人 
知道 上 一 次 扔 出 的 是 哪 一 面 了 ) 。 

戴 康 尼斯 对 于 洗 牌 问题 也 非常 感 兴趣 。 有 人 问 他 究竟 要 洗 多 少 次 牌 ， 牌 才 会 
真正 的 变 成 随机 的 (当然 如 果 是 他 洗 牌 的 话 ， 不 管 洗 多 少 次 他 完全 可 以 用 一 些小 
技巧 让 牌 永远 都 不 会 随机 ) 。 当 你 买 来 一 副 新 牌 时 ， 所 有 的 牌 都 是 按照 花色 和 大 
小 顺序 排列 的 。 你 洗 了 几 次 之 后 将 牌 都 摊 开 放 在 果 上 。 如 果 你 发 现 有 五 张 连 续 的 
红 桃 ， 或 者 是 七 张 连续 的 方块 ， 你 也 许 会 认为 自己 洗 牌 没有 洗 好 ， 这 一 副 牌 还 不 
是 随机 的 。 如 果 把 这 个 问题 转化 成 一 个 概率 问题 ， 我 们 必须 用 数学 的 术语 来 定义 




























































































加 ” 皮 埃 尔 - 西 蒙 ' 拉 普 拉 斯 这 位 概率 学 先驱 也 是 一 个 决定 论 的 坚定 信仰 者 。 他 认为 随机 性 唯一 的 作 
用 就 是 描述 完全 不 相关 的 信息 。 
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洗 牌 ， 同 时 也 要 说 明 怎 么 样 的 牌 才 算是 随机 的 。 读 者 们 可 以 自己 来 设 定 这 些 标 
准 ， 我 在 此 不 予 袭 述 。 戴 康 尼 斯 得 出 的 结论 非常 的 有 趣 。 他 认为 洗 牌 次 数 少 于 五 
次 ， 牌 依然 还 是 不 随机 的 ， 但 是 七 次 以 后 就 会 变 成 随机 的 。 从 不 随机 到 随机 的 改 
变 集中 发 生 在 第 五 次 到 第 七 次 之 间 。 

货 子 的 随机 性 也 引起 了 戴 康 尼斯 的 兴趣 ， 但 他 认为 这 个 问题 比 扔 硬币 和 洗 牌 
要 难得 多 。 这 一 点 都 不 让 人 觉得 惊讶 。 毕 竟 ， 高 尔 顿 嚼 士 早 就 告诉 过 我 们 仍 子 在 
仍 中 里 会 到 处 乱 跑 的 。 


























9.5 结语 


在 第 1 章 中 ， 我 们 用 扔 硬币 作为 随机 性 的 例子 一 块 走 进 了 概率 的 世界 ， 开 
始 了 我 们 的 旅程 。 这 一 路 上 我 们 学 习 了 很 多 东西 ， 你 也 发 现 了 我 们 日 常生 活 中 
处 处 都 充满 了 概率 。 我 们 谈论 过 法 庭 的 审判 、 医 学 试验 、 赌 场 、 选 举 ， 德 国 坦 
殉 还 有 也 德尔 的 聋 豆 ; 你 也 学 会 了 随机 游 走 、 期 望 值 、 误 差 范围 和 切 比 雪夫 不 
等 式 。 戴 康 尼斯 利用 频 闪 观测 仪 观察 真实 硬币 试验 的 随机 性 让 我 们 转 了 一 大 轿 
又 重新 回 到 了 最 初 的 问题 ， 也 是 最 简单 的 扔 硬币 现象 。 到 了 我 该 说 再 见 的 时 候 
了 ， 让 你 自己 在 概率 的 世界 中 币 律 盗 意 。 和 希望 你 对 概率 有 了 更 深 的 了 解 ， 最 好 
将 它们 视 为 你 的 朋友 。 它 们 值得 你 认真 对 待 。 因 为 ， 正 是 它们 决定 着 我 们 每 个 
人 的 一 生 。 
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Probabilities: 
The Little Numbers That Rule Our Lives 


1. 二 战 时 统计 学 家 是 如 何 利用 缴获 德军 坦克 的 编号 推算 出 德军 的 军力 的 ? 

2. 一 个 错误 的 概率 计算 是 如 何 让 一 个 无 事 的 女人 经 历 了 三 年 的 牢狱 之 灾 的 ? 

3. 为 什么 当 你 在 公交 站 等 某 路 公交 车 时 总 感觉 等 待 的 时 间 特 别 长 ? 

4. 数字 37 有 何 神 秘 之 处 ? 

5. 长寿 村 真 的 能 让 人 延年益寿 么 ? 

这 些 问题 的 结论 可 能 使 你 大 跌眼镜 ， 但 却 都 是 理性 的 。 让 我 们 通过 这 本 书 来 
探索 发 现 日 常生 活 中 有 趣 的 概率 现象 吧 。 


nn 这 本 书 是 你 最 好 的 选择 。 它 全 面 
且 风 趣 地 介绍 了 如 何在 现实 生活 中 运用 概率 。 


一 一 Keith Devlin， 斯 坦 福 大 学 教授 ， 美 国 公共 广播 电台 中 的 “数学 小 子 ”， 
《数学 基因 》 和 《数学 本 能 》 的 作者 


“本 书 对 于 那些 有 时 会 违背 直 党 的 概率 事件 进行 了 有 趣 地 介绍 。 欧 佛 森 深 
入 浅 出 地 介绍 了 一 些 重要 的 原理 和 经 典 的 问题 ， 并 且 运 用 一 些小 插图 来 讲解 问 
一 一 John Allen Paulos， 天 普 大 学 教授 ，《 数 育 》 和 《数学 家 读 报 》 的 作者 





地 址 : 北京 市 百 万 庄 大 街 22 号 
邮政 编码 : 100037 
电话 服务 


服务 咨询 热线 : 010-88379833 
读者 购书 热线 : 010-88379649 
络 服务 





Copies of this book sold without a Wiley sticker on the cover are unauthorized and illegal 
978- 
机 工 官 网 : www.cmpbook.com 


机 工 官 博 : weibo.com/cmp1952 机 工 教 育 人 信服 务 号 Wl 
教育 服务 网 : www.cmpedu.com | |SBN 978-7-111-46263-7 9l787111N462637|> 


例 世 网 ; WW 和风 8 有 | 策划 编辑 昌 汤 喜 定价 : 38.00 元 










































































